민감도·특이도, 통제된 임상시험 환경서 진단기기 자체 성능 평가
양성예측도, ‘진단 대상 감염 여부’ 따라 수치 달라져

식품의약품안전처 유튜브 '자가검사키트 사용법' 영상 캡쳐 이미지
식품의약품안전처 유튜브 '자가검사키트 사용법' 영상 캡쳐 이미지

[라포르시안] 코로나19 진단 체계가 바뀌면서 ‘자가검사키트’ 사용량이 급증하고 있는 가운데 검사 결과 정확도에 대한 오해가 빚어지고 있다.

민감도 90% 이상 기준을 충족해 식품의약품안전처 허가를 받은 자가검사키트를 실제 선별진료소에서 사용한 결과 양성 진단을 받은 사람 중 76.1%만 진짜 양성으로 나타나 정확도가 떨어진다는 일부 언론 보도 때문이다.

식약처는 공식 블로그 ‘식약메이트’를 통해 민감도 90%로 허가받은 자가검사키트가 선별진료소 검사 현장에서는 양성예측도가 76%인 이유를 설명했다.

식품의약품안전평가원 의료기기심사부에 따르면 민감도와 양성예측도는 다른 개념이다. 식약처는 자가검사키트 허가 시 민감도와 특이도를 정확도 기준으로 보는 반면 실제 선별진료소 검사에서는 양성예측도를 평가기준으로 삼는다.

체외진단의료기기인 자가검사키트는 민감도와 특이도를 평가해 성능 기준을 충족해야 허가를 받을 수 있다. 즉 양성인 사람을 양성으로 얼마나 잘 찾아내느냐, 또 음성인 사람을 음성으로 얼마나 잘 찾아내느냐가 관건이다.

허가를 받기 위해서는 성능을 증명하는 임상시험을 진행한다. 이때 감염자와 비감염자가 각각 확인된 상태에서 이들이 진짜 양성 혹은 음성으로 진단되는지 그 비율을 보게 된다. 이는 통제된 실험 환경에서의 통계인 셈이다.

민감도는 임상시험에서 진짜 감염자를 대상으로 검사했을 때 자가검사키트로 양성이 진단되는 비율을 의미한다. 특이도는 진짜 비감염자를 대상으로 검사해 자가검사키트로 음성이 진단되는 비율을 말한다.

식약처는 이를 통해 민감도 90%·특이도 99% 이상으로 성능이 입증된 자가검사키트만을 허가한다. 2월 4일 기준 총 5개 제품이 항원검사 방식의 코로나19 자가검사키트로 허가를 받았다.

그렇다면 민감도 90%·특이도 99%인 자가검사키트로 검사를 했는데 왜 양성으로 진단된 사람 중 76.1%만 진짜 감염자로 확인됐을까. 그 이유는 ‘진단 대상의 감염 여부를 알 수 있느냐 없느냐’의 차이 때문에 발생한다.

임상시험에서는 감염자와 비감염자가 확인된 상태에서 진단을 하는 반면 실제 검사 현장에서는 감염 여부를 모르는 상태에서 진단을 시행한다. 즉 양성예측도란 누가 감염됐는지 모르는 상태에서 자가검사키트를 통해 양성으로 진단된 사람들 가운데 PCR 검사로 진짜 감염자를 확진한 비율을 말한다. 다시 말해 민감도와 양성예측도는 완전히 다른 개념인 것이다.

양성예측도는 실제 현장의 감염 상황에 따라 변화가 생긴다. 얼마나 많은 사람이 실제 감염됐느냐에 따라 결과가 달라지는 것. 감염된 사람이 많으면 양성예측도는 올라가고, 감염된 사람이 적으면 양성예측도가 내려간다.

많이 감염됐으니 감염된 사람을 진단할 수 있는 가능성이 높아지고, 적게 감염된 상황이면 감염된 사람을 진단할 가능성도 그만큼 낮아지는 것이다.

가령 국민 100명 중 3명이 감염된 상황을 가정했을 때 민감도 90%·특이도 99%인 자가검사키트를 현장에서 사용하면 자가검사키트로 양성이 나타난 사람 중 진짜 감염자가 나타나는 비율, 즉 양성예측도는 73.6% 정도로 나타난다.

만약 국민 100명 중 10명이 감염된 상황이라면 민감도 90%·특이도 99%인 자가검사키트를 사용했을 때 양성예측도는 90.9%로 높아진다. 반대로 만약 100명 중 1명이 감염된 상황이라면 양성예측도는 47.6%로 낮아지게 된다. 당연히 양성예측도가 높아지는 건 그만큼 감염자가 많은 것이기 때문에 좋은 일이 아니다.

이처럼 감염자가 많아질수록 양성예측도가 높아지는 상관관계는 유럽질병관리예방센터(ECDC) 자료에서도 확인할 수 있다. 그렇다면 식약처는 왜 처음부터 자가검사키트의 허가 기준을 양성예측도가 아닌 민감도와 특이도를 사용해 혼란을 야기할까라는 의구심이 생길 수 있다.

주지하다시피 임상시험은 체외진단의료기기 자체의 ‘성능’을 평가한다. 임상시험에서는 감염자와 비감염자의 수를 제한해서 진행하는 만큼 임상에서 측정하는 민감도·특이도는 감염자 비율을 반영하면 값이 달라지는 양성예측도보다 진단기기 성능 자체를 정확히 평가할 수 있기 때문이다.

중요한 건 민감도와 양성예측도의 숫자가 다르다고 자가검사키트의 진단 정확도가 떨어지는 것이 아니라는 점이다.

저작권자 © 라포르시안 무단전재 및 재배포 금지