본문 바로가기 주메뉴 바로가기 검색 바로가기
새로운 알고리즘, 헬스케어에서 인종간 불평등 해소한다
상태바
새로운 알고리즘, 헬스케어에서 인종간 불평등 해소한다
환자가 직접 보고한 내용으로 훈련받는 머신러닝 프로그램이 전문의가 특히, 흑인 환자의 진단에서 놓친 부분을 발견해냈다.
By TOM SIMONITE, WIRED US

인공지능(AI)으로 헬스케어 개선에 힘쓰는 연구진은 대게 알고리즘이 기계의학 학교에 의존하도록 한다. 소프트웨어는 스스로 피부 사마귀로 의심되는 경우나 코로나19 발병 징조를 나타내는 폐 건강을 정확히 발견해낼 때까지 인간 전문가가 분류한 수천 개 혹은 최대 수백만 개의 X선 데이터를 받아들이면서 의사에게서 의학 진단에 필요한 지식을 배운다.

2021년 1월에 공개된 연구는 다른 접근 방식을 택했다. 연구진은 관절염 증상을 찾기 위한 무릎 X선 이미지를 읽도록 알고리즘을 훈련했다. 이 과정에서는 의사 대신 환자가 AI에 영향을 주었다. 그 결과, 방사선 전문의가 흑인 환자의 X선 이미지를 판독할 때 말 그대로 분명하게 보지 못한 부분이 존재할 가능성을 보여주었다.

환자의 보고를 기반으로 훈련받은 알고리즘은 의사가 흑인 환자가 겪는 통증을 설명하는 것보다 더 훌륭했다. 또, 알고리즘은 보통 인간이 간과하는 이미지 내 질병 패턴을 분명히 발견해냈다.

보건 불평등 문제를 연구하나 이번 실험에 관여하지 않았던 웨일코넬의과대학 교수 사이드 이브라힘(Said Ibrahim)은 “환자의 보고를 기반으로 훈련받은 알고리즘은 방사선 전문의를 비롯한 여러 분야의 의사가 현재 사용하는 진료 전략을 재평가해야 한다는 사실을 시사한다”라고 말했다.

의사의 지식을 흉내 내지 않고, 의사가 간과한 부분을 발견하도록 설계된 알고리즘은 헬스케어의 평등을 향상할 수 있다. 새로 발표된 연구 평가에서 이브라힘 교수는 관절염 수술에서의 환자 간 격차를 줄일 수 있을 것으로 내다보았다. 그는 흑인 환자가 최소한 골관절염을 앓고 있는 것이 분명한 상황에서도 무릎 관절 수술을 받을 확률이 40% 더 낮았다는 사실을 지적한다. 소득과 보험 격차가 그 부분적인 원인이 될 수 있지만, 진단 과정에서도 차이가 있었다.
 
“알고리즘은 방사선 전문의가 보는 것보다 더 많은 부분을 본다.”
지아드 오버메예, 캘리포니아대학교 버클리캠퍼스 공중보건 대학교수

캘리포니아대학교 버클리캠퍼스 공중보건 대학교수 겸 연구 논문 저자인 지아드 오버메예(Ziad Obermeyer)는 AI를 사용해 의학적으로 설명하기 어려운 문제 때문에 방사선 전문의가 보지 못하는 부분을 조사하도록 영감을 받았다. 오랫동안 운영된 국립보건연구소의 골관절염 연구 결과, 흑인 환자와 저소득층 환자가 방사선 전문의가 질환 수준을 비슷하게 평가한 다른 환자보다 실제 통증을 더 많이 호소한다는 사실이 확인됐다. 그 차이는 무릎 질환 지식이나 심리적, 사회적 차이를 잘 알지 못하는 신체적 요인에서 비롯될 수 있다. 하지만, 이를 어떻게 분류할 것인가?

오버메예 교수와 스탠퍼드대학교, 하버드대학교, 시카고대학교 소속 연구진은 NIH 데이터를 이용해 컴퓨터 비전 소프트웨어를 생성해, 인간 의사가 놓친 부분을 조사했다. 연구팀은 알고리즘이 X선 이미지로 환자의 통증 정도를 예측하도록 구성했다. 소프트웨어는 수만 개의 이미지를 통해, 통증과 상관관계가 있는 픽셀 단위의 형태를 발견했다.

이전에 본 적이 없는 X선 이미지를 주었을 때, 소프트웨어는 환자가 보고했을 통증 예측을 위한 패턴을 이용했다. 예측 결과는 방사선 전문의가 제출한 무릎 X선 이미지, 특히 흑인 환자의 X선 이미지보다는 환자의 통증과 더 밀접한 상관관계를 지녔다. 이는 알고리즘이 방사선 전문의가 알지 못하는 질병 감지 증거를 학습했다는 의미이다. 오버메예 교수는 “알고리즘은 방사선 전문의가 보는 것보다 더 많은 부분, 즉, 흑인 환자의 통증 유발 원인을 본다”라고 말했다.
 
[사진=Freepik]
[사진=Freepik]

역사를 보면, 방사선 전문의가 흑인 환자의 무릎 통증을 능숙하게 평가하지 못하는 이유를 알 수 있다. 오늘날 사용하는 표준 평가는 1957년, 잉글랜드 북부 지방의 공업 도시에서 시행된 소규모 연구를 기반으로 제작됐다. 당시 연구가 이루어진 마을의 인구는 현대 미국만큼 다양하지 않았다. 많은 의사가 당시의 연구를 좁은 연골과 같이 자신이 관찰한 것을 기반으로 골관절염의 심각도를 평가할 방법을 고안하는 데 사용했다. 현재, X선 장비와 생활 방식을 비롯한 여러 요소가 과거와 많이 달라졌다. 오버메예 교수는 “오늘날 의사가 진료소에서 관찰한 것을 포착하지 못하는 것이 놀라운 일은 아니다”라고 말한다.

오버메예 교수 연구팀의 연구는 AI가 전문가의 의견이 아닌 인간 환자의 피드백으로 훈련받을 때 발생하는 일만이 아니라 의학 알고리즘이 종종 편견에서 의학 알고리즘에서 치료 대신 편견을 일으키는 사례가 종종 발견됐다는 사실에 주목한다. 2019년, 오버메예 교수 연구팀은 미국 환자 수백만 명을 진찰한 AI 알고리즘이 흑인 환자보다 백인 환자에게 당뇨병 등 더 복잡한 당뇨병 진단 및 치료에 도움을 주는 것을 입증했다. 

오버메예 교수의 새로운 연구는 알고리즘이 손쉽게 편견 문제를 발견할 수 있는 방식을 설명한다. 그나 알고리즘 모두 X선 이미지에서 의사가 놓치는 부분을 본다. 연구팀은 인공 신경망을 사용했다. 바로 많은 AI 애플리케이션을 더 실용적으로 만드는 기술이다. 그러나 인공 신경망은 다루기 매우 까다로워, 전문가는 이를 ‘블랙박스’라고 칭한다.

에모리대학교 방사선 전문의 겸 부교수인 주디 기초야(Judy Gichoya)는 무릎 알고리즘이 알고 있는 사실을 발견하고자 한다. 이는 인간의 노동력과 독창성에 달려있다.

기초야 부교수는 더 광범위하고 다양한 X선과 각종 데이터를 수집해, 알고리즘 성능을 평가하고자 한다. 방사선 전문의에게 X선 정보를 더 자세히 입력하도록 요청하고, 통증을 예측하는 알고리즘의 결과와 비교하면서 알고리즘이 이해하는 바와 관련된 단서를 찾으려 한다. 기초야 부교수는 인간 의사에게 너무 낯선 결과가 나오지 않기를 바란다. 그는 “전문의가 보아야 하지만, 잘못된 방식으로 보는 것이 알고리즘과 인간의 차이점일 수도 있다”라고 말했다.

관련 기사: AI, 부유한 국가 환자에게만 일부 질환 진단 도움준다?

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
New Algorithms Could Reduce Racial Disparities in Health Care
이 기사를 공유합니다
RECOMMENDED