길병원 공개한 진단 사례서 일부 암질환 진단일치율 낮아..."진단 정확도 검증부터 선행돼야"

[라포르시안] "임상에서 왓슨이 상당히 높은 수준의 진료 서비스를 정확하게 제안하는 것으로 평가하고 있다. 왓슨의 최적화된 제안과 다양한 진료과 전문의의 다학제 진료, 전문 코디네이터의 의견 등이 반영되기 때문에 실제 임상에서 대부분의 환자들은 믿을 수 있는 진료를 받는 느낌을 받을 것이다"

"하루가 다르게 최신 의학정보들이 쏟아져 나오는 시점에서 의사가 이 모든 정보를 습득할 수는 없기 때문에 왓슨이라는 새로운 ‘무기’는 암 환자 진료에 시너지를 극대화 할 것이다"

 “왓슨은 명확한 근거에 의해서만 판단을 내리며 특히 매일 쏟아지는 방대한 양의 최신 의학자료를 실시간 업데이트하므로 최적의 치료방법을 찾을 수 있다. 앞으로 지역 암환자들이 더 나은 치료법을 찾아 서울의 유명 대학병원을 전전하는 번거로운 관행도 줄일 수 있을 것으로 기대한다"

국내 병원들이 암환자 진료에 인공지능(AI) 시스템을 도입하면서 강조한 내용이다. 전문 의료진의 판단과 비교했을 때 진단 정확도가 높다는 점을 언급하면서 AI를 통해 유명 대학병원서 진료받는 것과 비슷한 수준의 암 치료 서비스를 받을 수 있다고 은연 중에 암시한다.   

작년 말 가천대 길병원이 국내 처음으로 IBM에서 개발한 '왓슨 포 온콜로지'를 도입한 이래 부산대병원, 건양대병원, 계명대 동산병원, 대구 가톨릭대병원 등 지금까지 총 5개 병원에서 왓슨을 도입했다.

그야말로 우후죽순처럼 생겨났다. 지금도 왓슨 도입을 검토하거나 구체적으로 도입을 추진하고 있는 병원이 적지 않은 것으로 알려졌다.

이를 두고 의료계 일각에서는 지금의 왓슨 도입 열풍이 과연 정상적인 상황인지, 무엇보다 암환자들에게 실질적인 도움이 될 것인지 신중하게 따져봐야 한다는 지적이 나오고 있다.

가장 시급한 게 왓슨을 이용한 암환자 진료의 안전성과 유효성 검증이다. 

지금까지 왓슨을 도입한 병원들은 이 시스템이 300개 이상의 의학저널, 200개 이상의 의학교과서, 1500만 페이지에 달하는 의료정보와 치료 가이드라인을 분석해 각각의 환자에게 최적의 치료법을 제안한다는 식으로 장점을 홍보해 왔다.

심지어 왓슨 도입을 통해 암환자의 수도권 대형병원 쏠림 현상을 완할 수 있을 것이란 전망까지 제시하고 있다. 과연 그럴까.

우선 확인해야 될 게 왓슨의 진단 정확도다.

왓슨을 개발한 IBM에서 이 시스템의 진단 정확도를 홍보하는 근거가 지난 2014년 미국종양학회(ASCO)에서 발표된 메모리얼 슬론 케터링 암센터의 왓슨과 전문의 간 진단 일치율 연구결과이다.

당시 발표된 연구결과에 따르면 왓슨과 슬론 케터링 암센터 전문의 간 진단 일치율은 대장암 98%, 직장암 96%, 방광암 91%, 췌장암 94%, 신장암 91%, 난소암 95%, 자궁경부암 100%였다.

하지만 이 같은 연구결과는 동일한 환자 사례를 놓고 왓슨을 반복적으로 학습시킨 후 나온 결과라는 점에서 진단 정확도에 대한 입증자료로는 불충분하다는 지적이 제기됐다.

게다가 최근 들어 왓슨의 진단 일치율이 특정 암질환에서 크게 떨어진다는 연구결과가 잇따라 발표되고 있다.

작년 12월 싱가포르에서 열린 '2016 유럽종양학회 아시아 총회'(ESMO Asia 2016 Congress)에서는 인도 마니팔 병원(Manipal Hospitals)이  1,000명의 암환자를 대상으로 왓슨의 진단과 다학제 진료팀의 진단 일치율을 분석한 결과가 공개됐다.

분석 결과에 따르면 왓슨이 제시한 치료법은 권장 표준치료 50%, 고려할만한 치료 28%, 그리고 권장하지 않는 치료 17%로 분류됐다. 권장하거나 고려할만한 치료법에 해당하는 비율이 78% 정도였다.

그런데 권장하거나 고려할만한 치료법에 해당하는 비율은 암질환의 종류에 따라 큰 차이가 났다. 왓슨이 제시한 치료법이 '권장 표준치료'에 제시하는 비율은 직장암의 경우 85%로 높게 나타났지만 폐암에서는 17.8%에 그쳤다.

유방암의 경우 호르몬 수용체와 HER-2 유전자가 모두 음성인 삼중음성유방암은 '권장 표준치료' 일치율이 67.9%인 반면 HER-2유전자 양성유방암은 35%에 불과했다.

왓슨을 개발한 IBM이나 이 시스템을 도입한 국내 병원들이 주장하는 '왓슨의 진단 정확도가 90%가 넘는다'는 식의 주장과는 많은 차이가 났다.

가천대 길병원은 지난해 12월 IBM사의 인공지능 ‘왓슨 포 온콜로지(Watson for Oncology)’를 도입해 처음으로 암환자 진료에 활용했다. 사진 제공: 가천대 길병원
가천대 길병원은 지난해 12월 IBM사의 인공지능 ‘왓슨 포 온콜로지(Watson for Oncology)’를 도입해 처음으로 암환자 진료에 활용했다. 사진 제공: 가천대 길병원

길병원 "왓슨 진단 일치율 낮은 건 미국-한국 의료환경 차이 때문"

"암환자 진료에 적용하기 위한 윤리·제도적 문제 논의하는 게 우선" 지적도 나와 

지난 2일부터 6일까지 미국 시카고에서 열린 '2017 ASCO'에서 발표된 가천대 길병원의 왓슨을 이용한 암환자 진단 사례도 주목할 만하다.

길병원은 이번 학회에서 2~4기 결장암 환자 340명과  기, 제 3 기, 제 4 기 결장암 환자 340명과 항암화학요법을 받지 않은 진행성 위암환자 185명을 대상으로 왓슨과 전문의의 진단을 비교한 결과를 초록 형식으로 공개했다. <길병원이 '2017 ASCO'에서 공개한 '한국에서 결장암 및 위암 치료를 위한 인지컴퓨팅 시스템의 사용' 초록 발표자료 바로 가기>

분석 결과, 전체 결장암 환자에 있어서 왓슨과 전문의 간 진단 일치율은 73%(248명)였고, 결장암 환자 중 보조 항암치료를 받은 250명의 경우 85%(212명)의 일치율을 보였다. 또 전이성 결장암 환자 90명의 진단 일치율은 40%(36명)에 그쳤다.

그리고 진행성 위암 환자 185명의 왓슨과 전문의 간 진단 일치율은 49%(90명)로 파악됐다.

길병원 연구진은 "왓슨이 제시한 치료 옵션은 보조 항암치료를 받은 결장암 환자에서는 길병원 의료진의 결정과 상당수 일치했다"며 "전이성 결장암과 위암 환자에서 일치도가 낮은 건 왓슨이 학습한 미국의 병원과 길병원 간 실제 임상의 차이가 반영된 것"이라고 분석했다.

즉 왓슨이 학습한 미국에서 대장암과 위암 치료에 적용되는 항암요법이 한국에서는 건강보험의 적용을 받지 못해 의료진의 치료 결정 과정에서 배제되거나 혹은 그 반대로 한국에서 일차요법으로 널리 사용되는 항암요법이 미국에서는 그렇지 않은 상황이 진단 일치도를 떨어뜨리는 요인이 되고 있다는 것이다.

이런 결과는 왓슨이 암환자 진료를 학습한 미국의 진료지침과 의료보험 환경이 한국과 다르고, 항암제 반응이 인종간 차이를 보인다는 점을 고려해야 한다는 것을 의미한다.

따라서 국내 병원들이 왓슨 도입을 서두를 게 아니라 왓슨이 제공하는 진단과 치료법의 정확도에 대해서 충분한 검증이 선행될 필요가 있다.

김윤 서울대 의대 교수(의료관리학교실)는 "한국에서는 왓슨을 이용한 진행성 위암에서 진단 일치도가 49%에 불과한 이유가 왓슨이 학습한 미국 내 병원과 한국의 진료지침이 달라서라고 주장하는 데 과연 그런 이유 때문인지 아니면 다른 이유가 있는 것인지 확인이 필요하다"며 "또한 아직까지 진단 정확도가 입증되지 않은 왓슨을 환자 진료에 어떻게 활용했는지에 대해서도 명확한 설명이 필요하다"고 지적했다.

왓슨과 의료진의 진단이 일치하지 않을 경우 어떤 식으로 환자 진료에 활용할 것인가에 대한 지침도 마련돼야 한다고 강조했다.

김 교수는 "왓슨과 의료진의 판단이 일치하지 않을 때, 의사들이 왓슨의 권고를 단순히 참고했는지 아니면 왓슨의 권고를 따랐는지에 대해서도 환자에게 알려줘야 한다고 생각한다"며 "보다 근본적으로 (왓슨을 도입한 병원들이)암환자 진료 시 왓슨을 사용한 연구에 참여할 것인지에 대해 사전 동의를 얻는 절차가 있었는지도 의문"이라고 말했다.

일부 병원에서는 왓슨 도입을 통해 암환자의 수도권 대형병원 쏠림 현상을 개선할 수 있다는 주장도 제기하고 있다. 지방의 암환자들이 더 나은 치료법을 찾아 '빅5'같은 서울의 유명 대학병원을 전전하는 의료이용 관행이 줄어들 것이라고 주장한다.

그러나 암환자의 수도권 대형병원 쏠림 현상은 왓슨 도입을 통해 해결할 게 아니라 근본적으로 지역별 의료자원 배분의 형평성과 의료전달체계 확립을 통해 해결해야 할 사안이다.

김 교수는 "암환자의 수도권 대형병원 쏠림의 근원은 환자가 인지하는 병원 간 의료 질의 격차 때문"이라며 "따라서 이 문제의 근본적인 해결책은 의료 질 격차를 해소하고, 권역간 환자이동이나 경증환자의 대형병원 집중을 제한하는 정책 등을 동시에 추진하는 것"이라고 강조했다.

그는 "왓슨 도입을 통해서 수도권 '빅5'에 버금가는 환자 신뢰를 얻겠다는 건 일종의 꼼수이고, 환자를 속이는 행위"라며 "왓슨 도입을 놓고 호들갑을 떨게 아니라 진단 정확도를 검증하고, 인공지능 시스템을 암환자 진료에 적용하기 위한 윤리적, 제도적인 문제를 논의하는 게 우선"이라고 제안했다.

관련기사
저작권자 © 라포르시안 무단전재 및 재배포 금지