06 - 디지털 헬스케어와 개인정보보호 : 현재 문제점과 그 대안
▲ 신수용 교수 성균관대학교 디지털헬스학과
디지털 헬스케어를 활성화하기 위해서는 개인 건강정보의 활용이 필수적이다.
하지만 개인정보보호 이슈로 인하여 여러 논란이 발생하고 있다.
이 글에서는 현재 논란의 주된 원인들인 법/제도상의 모호성에 대해서 살펴보고, 이 모호성을 해결할 방안에 대해서 소개한다.
최근 인공지능, 빅데이터를 포함한 ICT 기술이 발전하고 인구 고령화가 심해지면서, 디지털 헬스케어에 대한 관심이 증가하고 있다.
디지털 헬스케어는 다양하게 정의할 수 있으나, 이 글에서는 헬스케어와 인공지능, 빅데이터, 사물인터넷, 클라우드 등의 기술들이 융합되어 헬스케어의 데이터를 수집·분석·활용하는 헬스케어 분야로 정의하겠다.
이렇게 정의하는 이유는 디지털 헬스케어는 결국 헬스케어 서비스이고, 이를 실현하기 위해서 가장 중요한 것은 ‘개인의 건강 데이터’이기 때문이다.
그런데 건강과 관련된 데이터는 국내 개인정보보호법에 민감정보01로 정의되어 있고, 일반 사람들도 가장 중요하고 민감하게 생각하는 데이터 중 하나이다.
이로 인해 일부에서는 디지털 헬스케어에 대해서 개인정보보호 이슈를 가지고 반대하고 있다.
이 글에서는 이와 관련된 여러 가지 이슈들에 대해서 국내법/제도를 기준으로 살펴보고자 한다.
디지털 헬스케어를 비롯한 개인의 데이터에 기반을 둔 산업들이 개인정보를 활용하기 위해서는 현재 제도상으로는 반드시 개인의 개별 사전동의(Informed consent)를 받아야 한다.
그런데 건강정보의 경우 개인의 동의가 완벽하게 개인정보를 보호해 주지 못하는 경우가 발생할 수도 있다는 문제점이 있다.
예를 들어 유전 질환이 있는 개인이 본인의 유전 정보를 활용하는 것에 동의하는 경우, 유전 질환이라는 특징 때문에 본인 가족들의 특정 유전 정보가 해당 가족 구성원들의 동의 없이 같이 제공되는 것이다.
이런 사례를 볼 때, 일부에서 주장하는 것처럼 개인의 동의가 모든것을 해결해 주지 않는다는 것도 주목해야만 한다.
그런데도 아직은 동의가 가장 확실한 방법이기 때문에 전 세계적으로 가장 많이 사용되고 있다.
최근 빅데이터 시대를 맞이하여, 대량의 데이터를 활용하기 위해서는 아주 많은 개인들에게서 동의를 획득해야 하는데, 대부분의 경우 시간 및 비용상의 문제 때문에 현실적으로 어려운 경우가 많다.
따라서 동의에 대한 대안으로 비식별화(De-identification) 혹은 익명화(Anonymization)가 제시되고 있다.
비식별화는 개인정보에서 개인을 식별할 수 있는 정보들을 제거하여 특정 개인을 알아볼 수 없게 하는 것인데, 현재 개인정보보호법에는 비식별화나 익명화에 대해서 명확하게 정의가 되어 있지 않고, 심지어 개인정보에 대한 정의도 명확하지 않다는 문제점이 있다.
개인정보보호법 제2조 제1호에 의하면 “개인정보란 살아 있는 개인에 관한 정보로서 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보(해당 정보만으로는 특정 개인을 알아볼 수 없더라도 다른 정보와 쉽게 결합하여 알아볼 수 있는 것을 포함한다)를 말한다”라고 정의하고 있다.
여기에서 문제는 개인을 알아볼 수 있는 정보가 무엇이냐는 것이다.
개인식별성은 특정 정보의 연결성(Connectivity)과 해당 개인에 대한 배경지식에 매우 의존적인데, 현재 개인정보보호법은 이러한 상황을 고려하지 않고 있다.
연결성에 대한 예를 들자면, 주민등록번호가 가장 막강한 개인식별정보인 것은 우리나라 모든 국민이 주민등록번호를 가지고 대부분의 정보에 연계가 가능하기 때문이다.
회사 사원번호, 학교 학번 등은 유사한 번호임에도 연결성은 거의 가지고 있지 않기에 개인식별성이 낮다.
또 다른 문제는 키와 몸무게는 민감정보인 건강정보라는 것이다.
그런데 여기서 모순이 생기는 것이 개인정보보호법상 개인정보는 개인을 식별할 수 있는 정보인데, 키와 몸무게만 가지고 식별하는 것은 거의 불가능하다는 것이다.
즉, 건강정보이지만 개인식별성을 가지지 않는 것이다.
이런 점들을 고려하면, 실제로 비식별화 시스템을 만들고 활용해야 하는 입장에서는 모호한 법적 정의가 큰 부담으로 다가오게 된다.
따라서 그림 1과 같이 정의를 명확하게 할 필요가 있다.
개인정보들이 전부 개인식별성을 가지지 않기 때문에, 개인정보와 개인식별정보를 구분해야 하고, 민감정보 중 개인식별성을 가지는 정보도 있지만 개인과 관련되지 않은 정보가 있다는 것도 명확히 할 필요가 있다.
예를 들면 회사의 기밀정보는 민감정보이나 개인과 관련되지 않은 정보이다.
개인정보의 정의를 그림 1같이 수정하더라도 비식별화 혹은 익명화도 법적 정의가 모호하다는 한계가 있다.
개인정보보호법 제3조 제7항을 보면 “개인정보처리자는 개인정보의 익명처리가 가능한 경우에는 익명에 의하여 처리될 수 있도록 하여야 한다.”라고만 정의가 되어 있고, “익명” 또는 “비식별”에 대한 정의는 없다.
개인정보보호법을 기반으로 한 “개인정보 비식별 조치 가이드라인”에 의하면 “비식별 조치는 정보집합물에서 개인을 식별할 수 있는 요소를 전부 또는 일부 삭제하거나 대체하는 등의 방법을 활용, 개인을 알아볼 수 없도록 하는 조치”라고 정의하고 있다.
다만 이 가이드라인은 법적인 효력이 없다는 한계가 있다.
이러한 문제점을 해결하기 위해서 4차산업혁명위원회에서 규제/제도혁신 해커톤을 3차례에 거쳐 진행하여, 개인정보, 가명정보, 익명정보로 개인정보를 구분하고, 익명정보는 개인정보보호법의 대상이 아니며, 가명정보는 상업적인 용도를 포함한 학술 연구 목적으로 활용할 수 있도록 허용하기로 합의를 하였다.02
그러나 여전히 구체적인 개인정보, 가명정보, 익명정보에 대한 정의를 추후에 진행하기로 했다는 한계가 있다.
그런데 건강정보와 관련해서는 “생명윤리 및 안전에 관한 법률(생명윤리법)”에 위의 불명확한 상황들이 아주 잘 정의되어 있다.
동법 제2조 제17호에 의하면 “개인식별정보란 연구대상자와 배아·난자·정자 또는 인체유래물의 기증자(이하 “연구대상자 등”이라 한다)의 성명·주민등록번호 등 개인을 식별할 수 있는 정보를 말한다.”라고 정의되어 있고, 이어서 제18호에는 “개인정보란 개인식별정보, 유전정보 또는 건강에 관한 정보 등 개인에 관한 정보를 말한다.”라고 명확히 개인정보와 개인식별정보를 구분하여 정의하고 있다, 또한 제19호에 “익명화(匿名化)란 개인식별정보를 영구적으로 삭제하거나, 개인식별정보의 전부 또는 일부를 해당 기관의 고유식별기호로 대체하는 것을 말한다.”라고 명확히 정의되어 있다.
따라서 개인정보보호법의 모호성이 대부분 해결될 수 있기 때문에, 특별법 우선의 원칙에 의거하여 기본법인 개인정보보호법이 아닌 특별법인 생명윤리법에 의거하여 보건의료데이터를 취급하는 것이 합리적인 선택으로 판단된다.
특히 생명윤리법에 의하면 개인의 데이터를 사용하기 위해서는 반드시 기관윤리심의위원회(IRB)의 승인을 받도록 되어 있다.
물론 익명화된 경우 심의면제를 받을 수도 있으나, 심의면제를 위해서도 기관의 승인이 필요하기 때문에 데이터의 남용을 막을 수 있는 안전장치가 있다는 장점이 있다.
따라서 현재 기업체들이 비식별화된 정보를 자유롭게 사용해 달라고 하고 있는 상황에서 시민단체의 우려를 해소하고, 기업체들의 요구도 절충할 수 있는 하나의 좋은 방안이라고 생각한다.
마지막으로 100% 안전한 익명화라는 것은 절대로 존재할 수 없다는 점을 반드시 명심해야 한다.
첫 번째로 개인의 식별성은 대상자에 대한 배경지식에 아주 Special Issue 06의존적이기 때문에 항상 모호한 영역이 존재한다.
두 번째로 100% 익명화가 되면 사용할 수 있는 정보가 하나도 남지 않는다는 문제점이 있다.
100% 익명화는 결국 아무런 정보를 주지 않는 것 외에는 성립할 수 없기 때문이다.
정보 공개와 개인정보보호를 모두 완벽히 만족시키는 이상적인 상황은 존재할 수 없고, 그 두 가지는 서로 트레이드 오프(Trade-off) 관계라는 것을 인식하여 적정한 선에서 활용 가능한 정보와 개인정보보호 사이에서 타협해야만 한다.
그런데 지금 국내의 분위기는 100% 완벽한 익명성을 요구하는 듯한 분위기라 우려가 있다.
어떤 선에서 타협을 볼 것인지 결정하는 것이 결국 정부의 역할이다.
이러한 상황에서 유네스코의 국제생명윤리위원회(International Bioethics Committee)에서 2017년 9월 15일에 발표한 “Report of the IBC on Big Data and Health03”에 주목할 필요가 있다.
해당 보고서는 현재 통용되고 있는 데이터 소유의 권한에 대한 개념에서 건강정보만이라도 책무성과 이익 공유로 발상을 전환해야 한다고 주장하고 있다.
왜냐하면 건강 데이터가 활발히 공유될수록 이를 통해 보건의료 기술이 발전하기 때문에 많은 사람들에게 이익을 줄 수 있고, 개인정보 소유권의 문제로는 현재의 윤리적/법적 문제를 해결하기 어렵다는 현실적인 한계가 있기 때문이다.
따라서 데이터 소유자 개개인에게 이익을 환원하는 방식이 아니라, 사회 일반에게 권리와 이익이 돌아가도록 패러다임을 전환하여 디지털 헬스와 개인정보보호의 문제에 대해서 논의해 볼 필요성이 있다.
01 개인정보보호법제조 제23조
02 https://www.4th-ir.go.kr/hackathon/list
03 http://unesdoc.unesco.org/images/0024/002487/248724E.pdf