서울아산병원 박성호 교수, 관련 논문 516편 분석 결과

[라포르시안] 의료·의학영상 분야에서 인공지능(AI)을 기반으로 한 제품이 속속 개발되고 있지만 실제 임상진료 상황을 반영한 정확도를 검증한 경우는 극히 드문 것으로 나타났다. 

서울아산병원 영상의학과 박성호(사진) 교수팀은 대한영상의학회 국제학술지 'KJR(Korean Journal of Radiology)' 3월호에 이런 분석 결과를 담은 논문을 발표했다. 

박 교수팀은 지난해 1~8월까지 전 세계에서 출간된 모든 관련 논문(Pubmed, Embase) 약 2,700건을 정리해 최종 516편의 유관논문을 분석했다. 

분석 결과 516편 중 AI의 정확도를 어떤 형태든 외부검증(external validation)으로 확인한 논문은 6%에 그쳤다.

실제적인 임상진료상황에 맞춰(diagnostic cohort design) 정확를 검증한 경우는 1%, 좀 더 엄밀한 기준으로 임상적 정확도를 검증한 것은 0%였다.

의료용 AI의 정확도에 대해 제대로 된 임상검증과 엄격한 사전검증 절차가 필요한 이유는 신체와 건강에 직간접적인 영향을 주기 때문이다.

의료용 소프트웨어는 의약품이나 치료용의료기구와는 달리 환자에게 직접적인 위해가 되지 않는다고 생각하기 쉽다.

하지만 충분히 검증되지 않은 AI 소프트웨어 프로그램이 내린 진단오류는 환자의 건강에 심각한 위험을 초래할 수 있고 불필요한 의료비 상승으로 이어질 수 있다.

박성호 교수는 "그동안 의료 AI의 임상적 정확도를 제대로 검증하지 않는 것에 대해 우리나라뿐 아니라 미국, 영국의 의학계로부터 많은 문제제기가 있었지만 구체적인 자료를 통해 확인한 것은 이번 연구가 처음"이라며 "예상보다 낮은 결과에 연구진도 놀랐고 의료·의학영상 AI 분야가 임상검증을 얼마나 간과해 왔는지 그간의 민낯을 보여주는 결과"라고 지적했다. 

박 교수는 "정부도 의료 AI 산업의 진정한 육성과 경쟁력 강화를 위해서는 기술 개발 지원이나 규제의 완화, 신속한 허가와 같은 직접적 사업화 지원뿐만 아니라 보다 근본적으로 제대로 된 임상검증을 촉진·지원하는 것이 중요하다는 것을 이해하고, 실질적인 지원이 필요하다"고 말했다. 

이번 연구는 최근의 의료·의학영상 AI 분야 연구들을 비판려는 목적이 아니라는 점도 분명히 했다.  

한편 이번 분석에 포함된 논문 중 영상의학과 분야 연구가 약 70%를 차지했다. 의료 AI와 관련해 영상의학과의 역할과 책임이 크다는 것을 보여주는 결과다. 

박 교수는 "그 동안 의료 AI의 임상검증이 간과된 중요한 이유 중 하나는 개발자나 산업계가 현장의료와 임상검증에 대한 자세한 정보와 교육을 접할 기회가 적었기 때문"이라며 " 앞으로 의료인들이 AI 개발자 및 산업계와 좀 더 적극적으로 소통을 하고 교육과 정보제공의 기회를 만들어야 할 것"이라고 강조했다. 

저작권자 © 라포르시안 무단전재 및 재배포 금지