AI 트렌드
인공지능을 활용한 질병 조기 진단
2018/08/22 by 이수경

전문 의료진은 각종 검사를 통해 환자의 병을 진단하고 치료법을 제시합니다. 때에 따라서는 더 정확한 진단을 위해 방사선영상이나 조직 슬라이드를 스캔한 병리영상을 판독하기도 합니다. 하지만 10만*10만 픽셀 크기의 영상에서 100*100픽셀 크기의 비정상적인 부위를 사람의 눈으로 찾는 일은 정말 어려운 일에 속합니다. 예시를 한 번 보겠습니다. [그림 1]에서 왼쪽 3개 이미지는 종양 패치, 오른쪽 3개는 정상 패치입니다. 쉽게 구분하실 수 있으시나요? 아무리 전문적인 수련 과정을 거친 병리의사라 하더라도 육안으로는 종양과 정상 패치를 구분하는 게 쉽지는 않음을 확인해볼 수 있습니다.

[ 그림 1 ] 출처 : 기가픽셀 병리학 이미지에서 암전이 감지하기(Detecting Cancer Metastases on Gigapixel Pathology Images)

영상에 따라서는 분석에 수십 분에서 수 시간이 걸리기도 합니다. 판독이 난해한 경우라면 의사 한 명이 하루에 분석할 수 있는 영상은 많아야 2~3명분입니다. 사람의 눈으로 확인하는 작업이다 보니 같은 환자를 두고 서로 다른 진단을 내리기도 하죠. 

모니터에서 지원하는 해상도, 명암비, 휘도 등의 요소에 따라 영상이 온전하게 보이지 않을 가능성도 완전히 배제할 수 없습니다. 판독용 모니터는 의료용 디지털 영상 및 통신 표준(DICOM), 5백만 화소, 고대조도, 최소 8비트 조건의 고해상도와 같은 요소를 필수로 지원해야 합니다. 그러나 현실에서는 고가의 장비라는 것을 이유로 구매나 이용이 제한될 가능성이 사실상 더 크죠.

전문의가 한정된 시간 안에 검토해야 하는 많은 정보를 감안한다면 오진의 가능성을 완전히 배제할 수 없는 이유입니다. 대표적으로, 암 오진 피해의 원인으로는 추가 검사를 소홀히 하거나 판독오류라는 응답 비율이 가장 높은 것으로 알려져 있죠.

이에 효율적으로 의료영상을 판독하려는 목적에서 딥러닝(deep learning)이 도입되고 있습니다. 최근 연구 동향은 인간 의사보다 더 높은 정확도로, 더 빠르게 분석하는 걸 목표로 하죠. 방대한 규모의 의료빅데이터를 딥러닝으로 분석한다면 의사는 좀 더 빠르게 환자를 진단할 수 있고, 환자는 한시라도 빨리 적절한 의학적 조치를 받을 수 있을 것으로 기대됩니다. 인디애나 대학교(Indiana University)의 케이시 베넷(Casey Bennett) 연구원은 “인간과 기계가 각자 잘하는 일에 집중한다면, 궁극에는 양쪽 모두의 잠재력을 극대화하는 지점에 이를 것”이라고 분석하고 있죠.

인공지능은 이처럼 의료의 질을 높이는 것은 물론, 의료비를 낮추는 데도 효과가 있을 것으로 보입니다. 인공지능 알고리즘 활용 시 의료진의 진단 성과는 41.9% 높아지고, 의료비는 58.5% 절감된다는 연구 결과가 이를 뒷받침합니다. 미국 최대 의료관리업체인 카이저 퍼머넌트(Kaiser Permanente)의 사례도 주목할 만하죠. 카이저는 회원의 의료정보를 통합 관리해 심장질환에 대한 임상 결과를 개선했습니다. 아울러 병원 방문 횟수와 검사 가짓수를 줄여 10억 달러(약 1조 1,000억 원)를 절감한 것으로 추정됩니다.


인공지능 활용 잠재력이 높은 8가지 질병

한국은 국가 주도로 건강 검진을 실시하고 있습니다. 달리 말하면, 지속해서 축적되고 있는 의료 정보의 양과 질이 매우 높다는 의미이기도 하죠. 병원이 수 십 년간 축적해온 의료 데이터를 공유하고 검진을 통해 높은 확률로 질병을 발견하는 솔루션을 공동개발한다면, 불필요한 검사나 진료, 수술 비용을 감축할 수 있을 것으로 기대됩니다. 아울러 각 질환에 대한 환자별 바이오마커(bio-marker)[1]를 수집함으로써 맞춤형 정밀 의료 서비스 또한 가능해질 것으로 기대됩니다.

이는 과학기술정보통신부가 지능형 정밀의료 솔루션 사업인 ‘닥터 앤서(Dr. Answer)’ 개발을 발표한 배경입니다. 닥터 앤서는 다양한 의료 데이터(진단정보, 의료영상, 유전체 정보, 생활방식 등)를 연계·분석해 개인 특성에 맞는 질병 예측·진단·치료 등을 지원해주는 서비스죠.

카카오브레인 또한 닥터 앤서 사업에 참가하고 있습니다. 지능형 소프트웨어 개발에 필요한 데이터의 통합관리 및 소프트웨어 개발 지원을 위한 플랫폼을 개발하고 있죠. 지난 1년간 자체적으로 터득한 클라우드 운영 노하우를 녹여내 플랫폼을 구성하는 데 역량을 쏟을 예정입니다.

카카오브레인은 닥터앤서가 맞춤형 정밀 의료 서비스 개시를 위한 발판이 됐으면 하는 바람입니다. 그리고 높은 정확도로 병을 신속하게 진단하는 지능형 소프트웨어가 필요한 이유를 설명하려면 현재 의료진과 환자가 마주하는 현실에 대해서도 자세히 알릴 필요가 있다고도 판단했습니다. 이에 이번 글에서는 8가지 질병을 진단하기 어려운 이유와 지능형 소프트웨어(인공지능)가 기여할 부분에 대해 간략하게 소개해보고자 합니다.

*‘의료데이터 분석 지능형 SW 기술개발 사업계획서’를 토대로 작성했습니다. 질병에 관한 보다 정확한 정보 제공을 위해 신문기사나 논문, 보고서를 추가로 참조했습니다.

*사업의 취지나 방향, 계획에 대해서는 다루지 않았습니다.

*학습데이터로 활용될 병원 데이터는 병원별 임상시험심사위원회 심의를 거쳐 개인정보에 대한 엄격한 비식별 조치를 수행하고, 데이터 수집·분석·활용·폐기 단계별로 보안체계가 적용된다고 합니다.


1. 심뇌혈관

국민 평균연령이 점점 높아짐에 따라 심혈관질환 유병률이 급격하게 증가하고 있습니다. 오늘날 단일 장기 기준 국내외 사망원인 1위를 차지하고 있죠. 특히 뇌동맥류[2] 질환은 75세 이상 고령에서 많이 발생하는데, 일단 발병하면 1/3이 사망할 정도로 그 심각성이 큽니다. 심뇌혈관 질환은 혈관이 터지기 전까지는 증상이 없는 만큼, 조기 검진을 통해 뇌동맥류 치료를 받는 것이 가장 좋은 방법으로 잘 알려져 있습니다.

심혈관질환은 카테터[3]를 활용해 진단합니다. 문제는 이런 침습적 검사는 비용이 많이 들고, 환자 신체에 부담을 준다는 점입니다. 검사 가짓수를 줄이고 비용을 낮추는 대안은 임상의에 상당한 숙련과 경험을 요구하기에 접근성이 낮습니다. 컴퓨터 단층촬영(CT)만으로도 심장(심혈관) 관련 중요한 진단정보를 획득할 수는 있으나, 분석시간이 길고 환자 정보를 고려한 예측 모델의 부재로 그 활용성은 아직 낮습니다.

따라서 전자의무기록(EMR) 데이터와 심혈관 의료영상 정보를 결합해 환자 맞춤형 심혈관질환 예측 모델을 만든다면, 추가 검사가 없어도 환자에 대한 정확한 진단과 밀접한 예후 관리가 가능하게 될 것으로 예상됩니다. 라인웍스(linewalks)가 개발 중인 의료 인공지능 ‘MDwalks EXI’가 바로 여기에 해당합니다. 처치, 검사, 투약, 처방에 따른 퇴원한 환자가 30일 이내 병원을 재방문할 확률과 사망 위험도를 보여주죠.

뇌동맥류는 CT와 자기공명영상(MRI)을 이용해 10분 만에 확인할 수 있습니다. 파열 가능성은 볼록하게 부푼 혈관 부위의 크기나 모양을 보고 판단할 수 있으며 영상학적인 추적 관찰이 필요합니다. 현재 이 모든 과정은 전적으로 숙련된 전문의에 의존하고 있어 신경외과 전문의가 없는 소외지역에서는 적절한 진단과 신속한 치료가 이뤄지지 않고 있습니다. 아울러 2차 합병증을 예측하는 기술은 국내외 전무한 실정이죠. 뇌 CT 영상에 딥러닝 기술을 결합한다면 뇌출혈 진단은 물론, 2차 합병증 예측까지 가능해질 것으로 기대됩니다.

2. 유방암

한해에만 1만 9,219명(2015년 기준)의 새로운 유방암 환자가 발생했습니다. 그 숫자는 매년 조금씩 늘어나 최근에는(2015년 기준) 17만 9,081명이 유방암을 앓고 있죠. 그나마 다행인 점은 다른 암보다 생존율이 높다는 점입니다. 조기에 발견해 적절한 치료를 받으면 앞으로 5년 이상 생존할 확률이 92.3%에 이르죠. 그러나 재발률이 6~20%에 달하는 만큼, 재발 여부에 대한 정확한 예측 및 발견, 치료가 매우 중요한 요소입니다.

즉, 유방암 생존자의 주기별 재발률을 예측해 적절한 시기에 검사를 받도록 안내하는 등 맞춤형 사후 관리 솔루션이 중요한 셈이죠. 물론 가장 좋은 치료는 예방입니다. 발병 위험도를 정확하게 예측하는 맞춤형 검진 프로그램이 단적인 예입니다. 앞서 설명한 대로 조기 발견이 생존율을 높이는 만큼 초기 단계의 유방암 환자를 정확하게 식별할 수 있어야 합니다.

그러나 국가암검진에 포함된 맘모그래피 검사[4]의 경우 그 정확도가 낮다는 문제가 지적되고 있죠 . 뿐만 아니라, 외국의 임상 지침이나 기관별 검진 지침을 따르는 등 한국인에 적합한 유방암 관련된 실용적인 도구가 부족합니다. 따라서 유방암 환자의 전주기 동안 생산되는 빅데이터를 활용, 한국인에 최적화된 유방암 예방, 진단, 치료 및 관리 솔루션 개발이 필요합니다.

3. 대장암

대장암은 국내에서 전체 암 발생률 3위(2015년 기준)를 차지하는 흔한 암종입니다. 서구화된 식습관과 진단 기술의 발달로 대장암 발생률은 더욱 급격히 증가하고 있죠. 다행인 건 80~90%의 대장암은 대장에 생긴 작은 혹인 용종(선종)에서 시작한다는 점입니다. 대장내시경 검사를 통해 이 용종을 조기 발견해 제거한다면 대장암에 의한 사망률을 66%나 낮출 수 있게 됩니다.

그러나 종종 비정상적인 케이스를 놓치는 상황이 종종 발생합니다. 대장은 길고 굴곡이 심하며 많은 주름진 형태를 띱니다. 숙련의가 대장 전 표면을 완벽하게 관찰하기가 어려운 이유입니다. 만약 이런 굴곡 내측에 작은 병변이 있다면 발견이 쉽지 않겠죠? 아울러 대장 점막의 미세한 변화나 1mm 사이즈의 암세포는 육안으로 쉽게 구별하기가 어렵습니다. 실제로 용종의 크기가 작을수록 간과율이 높아지는 경향이 있죠. 이런 이유로 대장내시경검사를 받은 지 수년 이내 대장암 진단을 받는 케이스가 종종 발생합니다.

따라서 대장 내 영상을 분석해 용종을 인식하는 딥러닝 알고리즘이 도입된다면, 이런 비정상적인 케이스를 놓칠 확률을 대폭 낮추는 데 크게 도움이 될 것으로 보입니다. 또한, 기술 숙련도가 낮은 대장내시경 검사자라도 이 시스템을 활용한다면 높은 정확도로 용종을 탐지, 절제할 수 있을 것으로 기대됩니다.

4. 전립선암

전립선암은 한국 남성 전체 암 발생률 5위(2015년 기준)를 차지하는 암종입니다. 그러나 전립선 병리 판독의 어려움과 병기 예측의 부정확성 등의 이유로 적절한 치료법을 선택하기가 어렵습니다.

단적인 예는 바로 전립선 특이항원(PSA) 선별검사[5]입니다. 1980년대부터 시행된 이 검사는 전립선암의 진단, 치료 후 추적검사에 필수로 시행되고 있습니다. 그러나 허위양성[6] 위험이 높아 과잉 진단과 과잉 치료의 원인이라는 지적이 일기도 했습니다. 이에 미국에서는 개개인(의사)의 판단에 맡기는 것으로 검사지침을 수정하기도 했죠. 한편, 치료 후 재발 및 전이를 예측하는 바이오마커의 성능이 낮다는 것도 아쉬움으로 남아있습니다.

따라서 전립선암 또한 진행 경과에 따른 의료 수요를 해결할 수 있는 의료 빅데이터 기반 지능형 소프트웨어 개발이 필요한 분야 중 하나입니다.

5.치매

고령화에 따라 치매 환자가 급격하게 증가하고 있습니다. 이에 따른 사회적, 경제적 비용 또한 비례해서 증가하는 추세죠. 증상개선을 위한 근본적인 치료제는 없지만, 치매를 초기에 발견하고 대증적 치료 및 건강관리를 통해 중증도 진행을 지연할 수 있습니다. 아울러 치매 진행을 늦추는 약물치료를 빠르게 진행할수록 높은 효과를 보입니다. 이러한 이유로 조기 진단은 치매 치료에 있어 가장 중요한 요소라고 볼 수 있습니다.

그러나 기존 치매 진단 기술은 증상이 뚜렷한 치매 환자를 구분하는 데 주안을 두고 있습니다. 초기 증상을 발견하는 데에는 한계가 있다는 소리죠. 이렇다 보니 신경심리검사와 뇌 자기공명영상(MRI) 검사에서 전문의가 그 결과를 해석하는 데 편차가 큽니다. 아울러 치매를 진단하는 소프트웨어의 부재로 전문가 문진, 인지기능 또는 행동수행 능력평가, 뇌영상검사 등을 종합적으로 판단해 진단하기까지 많은 시간이 소요된다는 것도 문제로 지적됩니다.

따라서 데이터를 종합적으로 판단해 치매 진단의 정확도를 높이는 지능형 진단 소프트웨어를 개발한다면 효율적인 비용에 치매를 진단할 수 있으면서도 접근성을 높이고, 확진에 따른 명확한 검사 계획을 수립할 수 있을 것으로 기대해볼 수 있습니다.

6. 뇌전증(간질)

뇌전증은 가장 흔한 신경계의 만성 질환입니다. 어원(악령에 의해 영혼이 사로잡힌다) 때문에 뇌전증을 정신질환으로 생각하는 사람들이 많아 사회나 개인에게 부정적으로 인식되는 측면이 강합니다하지만 뇌전증은 적절한 치료를 받으면 충분히 호전될 수 있는 질병입니다. 뇌전증은 뇌의 문제로 생긴 만성적인 신경성 질환으로, 환자의 70%는 적절한 약물치료를 통해 완치가 가능한 것으로 알려져 있습니다. 나머지 20~30%에 해당하는 난치성 뇌전증은 수술이나 시술을 통해 치료할 수 있죠.

뇌전증을 일으키는 원인과 발작 및 증후군 등을 분석하기 위해서는 디지털 뇌파에 대한 정량화가 필요합니다. 뇌파 측정의 디지털로 많은 양의 데이터는 축적되고 있습니다. 그러나 현재 신경과학 내에서 디지털 뇌파를 정량적으로 연구하는 데 큰 발전이 없고 임상과 연계는 부족합니다. 아울러 분석 도구의 편의성이 낮아 아직도 시각적 판단에 의존하는 경우가 대부분입니다. 뇌전증 환자의 뇌파 판독에 대한 의사 소견이 큰 편차를 보일 수밖에 없는 이유입니다.

따라서 뇌파 검사 시 측정되는 수치를 정량화하고, 많은 양의 검사 데이터를 빠르고 정확하게 판독하는 지능형 소프트웨어가 필요하다고 볼 수 있겠습니다.

7.소아희귀난치성유전질환

세계 약 7,000여 종이 넘는 것으로 알려진 희귀난치성질환(희귀질환, 희귀병) 예방과 치료에 관한 연구가 더딘 분야 중 하나입니다. 대표적인 희귀난치성 질환에는 발달장애와 신생아 난청이 있죠. 이런 희귀난치성질환은 진단 기법과 치료술 개선이 쉽지 않다는 이유로 간과되거나 방치되는 경우가 많습니다.

최근에는 이런 질환을 진단하는 유전자 검사 기법이 다양하게 발전하고 있습니다. 만만치 않은 검사 비용이 문제입니다. 아울러, 검사상에선 문제가 없는 새로운 돌연변이를 검출하거나 학계에 보고되지 않은 새로운 변이를 해석하고 표현형과의 관계를 명확히 밝히는 데 많은 어려움이 따릅니다. 이뿐만 아닙니다. 이런 유전자 데이터를 분석할 전문 인력도 부족하고, 유전 상담서비스 도입은 몇 년째 답보상태죠 .

유전자 변이는 인종별, 국가별 다른 분포를 보이는 특성을 갖추고 있습니다. 이에 따라 한국인의 인종적 특성이 반영된, 차별화된 변이 분석이 필요합니다. 아울러 앞서 언급한 문제를 해결하기 위해서는 유전자 검사를 시행하고 나서도, 일정 시간 후 같은 데이터베이스를 재분석하는 프로세스도 마련되어야 합니다. 이번 사업단에서는 발달장애 유전 변이와 난청 유전 변이를 해석하는 지능형 소프트웨어가 개발될 것으로 예상됩니다.

8.심장질환

최근 우리나라에서도 동맥경화에 의한 심근경색이나 협심증과 같은 심장질환을 앓는 환자가 늘고 있습니다. 우리나라 3대 사망 원인(암, 심장질환, 뇌혈관질환) 중 하나로, 심장질환으로 인한 사망자 수 또한 매년 증가하는 추세입니다. 다행히 환자가 흉통이나 호흡곤란과 같은 증상을 보이면 청진음과 흉부 단순촬영 또는 심전도 검사를 통해 심장질환을 진단할 수 있습니다.

[ 그림 2 ] 기존 심장질환의 진료 프로세스 문제점 © ‘의료데이터 분석 지능형 SW 기술개발 사업계획서

아쉽게도 청진음은 숙련도에 따른 정확한 진단에 대한 편차가 큰 편입니다. 진료 현장에서 그 중요도가 점차 줄어드는 이유죠. 대신 의료진은 심전도와 흉부 단순촬영 검사 결과를 종합해 의심 질환을 특정합니다. 문제는 불명확한 초기진단에 따른 과도한 추가검사(CT, MRI, 심장 초음파 등)가 남용되고 있다는 점입니다.

이에 지능형 소프트웨어를 활용해 기초검사(청음, 흉부 X선, 심전도)를 보다 더 정확하게 해석한다면, 불필요한 후속검사는 물론 진단에 걸리는 시간을 줄이는 데 큰 도움이 될 것으로 보입니다.


더 읽어볼 만한 글

- CSI 워크숍 - 딥러닝을 활용한 의료영상 판독 

- 브레인 클라우드 


참고
[1] 정상 또는 병리적인 상태, 약물에 대한 반응 정도를 객관적으로 측정해 줄 수 있는 표지자
[2] 뇌혈관이 약해지거나 염증이 생겨 혹처럼 부풀어오르는 뇌혈관 질환
[3] 병을 다루거나 수술할 때 인체에 삽입하는 의료용 기구
[4] X선을 이용한 촬영술로, 유방을 한쪽씩 기기 사이에 넣어 압축한 상태로 만든 뒤 촬영한다
[5] 임상적인 증상이 발생하기 이전 단계에서 암을 조기에 발견하고자 실시하는 검사. 정확하고 신뢰도가 높아야 하며 검사하기가 쉬워야 한다.
[6] 양성이 아닌데 검사상 양성으로 나오는 것
이 글을 쓴 사람들
samantha.lee
이수경 | samantha.lee@kakaobrain.com
2016년 3월 알파고와 이세돌 9단이 펼치는 세기의 대결을 두 눈으로 목도한 이후 인공지능을 제대로 공부해봐야겠다고 결심했습니다. 인공지능 본진이자 연구소인 카카오브레인으로 걸어들어온 이유죠. 인공지능 기술과 이로 인해 바뀔 미래 사회를 다루는 글을 통해 사람들과 소통하고자 합니다.