본문 바로가기 주메뉴 바로가기 검색 바로가기
딥마인드, 신규 AI로 유전 질환 예측한다
상태바
딥마인드, 신규 AI로 유전 질환 예측한다
구글의 AI팀이 새로 선보인 AI 모델인 알파미스센스는 DNA 변이 효과를 분석하고 희귀 질환 연구 속도를 높일 것으로 기대된다.
By AMIT KATWALA, WIRED UK

지가 아브섹(Žiga Avsec)은 10여 년 전, 의학 분야 박사학 학생이었을 당시 머신러닝으로 대학 모듈을 통해 단시간에 많은 내용을 학습해야 했던 유전학 강의를 수강했다. 그리고 얼마 지나지 않아 희귀병 연구소에서 근무하기 시작했다. 연구소 프로젝트는 비정상적인 미토콘드리아병을 유발하는 정확한 유전적 돌연변이를 정확히 찾아내는 것을 목표로 진행됐다.

아브섹은 당시 연구 프로젝트가 사막에서 바늘을 찾는 격이었다고 말했다. 인간의 생물학적 요소에 심각한 피해를 줄 수 있는 DNA 돌연변이인 유전자 코드에는 잠재적 발병 원인 수백만 가지가 잠재적으로 존재한다. 특별히 관심 대상이 된 부분은 유전자 변종의 불일치이다. 유전자 코드 단 하나라도 다르다면, 단백질 내에서 다른 아미노산이 생성된다. 아미노산은 단백질의 빌딩 블록과 같은 역할을 하며, 단백질은 신체 내 모든 부위의 빌딩 블록과 같은 역할을 한다. 따라서 매우 작은 변화도 크고, 광범위한 영역에서 영향을 미칠 수 있다.

현재 일치하지 않을 수도 있는 인간 유전자 수는 7,100만 개로 추정되며, 인간이 평균적으로 보유한 일치하지 않는 유전자 수는 9,000개 이상이다. 대부분 인체에 별다른 손상을 일으키지 않지만, 간혹 약간의 유전 변화가 결합한 것이 원인이 되는 2형 당뇨병과 같은 가장 복잡한 질환은 물론이고, 겸상 적혈구 빈혈증, 낭포성 섬유증 등 유전 질환을 동반할 수도 있다. 아브섹은 동료에게 실제 위험한 유전자 돌연변이를 알아낼 방법을 물어보았다. 그러나 전반적으로 알 수 없다는 답변이 돌아왔다.

수년간 큰돈을 투자하여 공들여 연구한 뒤 인체에서 일치하지 않은 것으로 확인된 유전자 돌연변이 400만 개 중 발병 원인이나 질병 양성으로 분류된 돌연변이는 단 2%라는 사실을 확인했다. 단 하나의 유전적 불일치 돌연변이의 영향을 연구하려면 수개월이 소요된다.

2023년 9월 19일(현지 시각), 아브섹이 객원 연구원으로 근무 중인 인공지능(AI) 연구 기업인 구글 딥마인드는 유전자 불일치 돌연변이를 찾아낼 속도를 높일 툴로 ‘알파미스센스(AlphaMissense)’를 공개했다. 알파미스센스는 일치하지 않는 돌연변이를 분석하고, 질병 발병 가능성을 90% 정확하게 예측하는 머신러닝 모델이다. 알파미스센스의 질병 예측 정확도는 기존 툴보다 더 높은 편이다.
 
[사진=Unsplash]
[사진=Unsplash]

알파미스센스는 딥마인드가 아미노산 구성 요소 내 단백질 수억 가지 구조를 예측하는 획기적인 모델인 알파폴드(AlphaFold)를 기반으로 구축됐다. 그러나 알파폴드와 알파미스센스는 다른 방식으로 희귀 질환을 예측한다. 알파미스센스는 단백질 구조를 예측하는 대신 오픈AI의 챗GPT와 같은 대규모 언어 모델에 더 가까운 형태로 작동한다.

알파미스센스는 인간과 영장류 생물학 언어로 훈련을 받았기 때문에 단백질 내 아미노산의 정상적인 배열이 어떠한 형태인지 안다. 잘못된 유전자 배열은 문장의 잘못된 단어와 같은 형태로 나타난다. 학술지 사이언스에 게재된 알파미스센스 연구 논문의 공동 저자로 아브섹과 함께 이름을 올린 준 쳉(Jun Cheng)은 “알파미스센스는 단백질 배열로 훈련받은 언어 모델이다”라며, “영어 문장으로 대체한다면, 영어에 익숙한 사용자는 영어 문장이 비문인가를 보면서 즉시 대체된 유전자 돌연변이가 정상인지 비정상인지 알 수 있다”라고 말했다.

딥마인드 연구 부사장 푸쉬미트 코리(Pushmeet Kohli)는 알파폴드와 알파미스센스의 차이점을 요리책에 비유했다. 알파폴드가 정확한 재료 조합 방식을 중시한다면, 알파미스센스는 잘못된 재료 조합의 결과를 예측한다.

알파미스센스는 잠재적인 유전적 불일치 돌연변이 7,100만 개를 각각 0~1점 사이로 구분하는 병원체 점수를 부여한다. 다른 돌연변이와의 밀접한 영향과 관련하여 알려진 바를 점수 책정 기준으로 삼는다. 점수가 높을수록 특정 돌연변이가 질병 발병 원인이 되거나 질병과 관련되었을 확률이 높다. 딥마인드 연구팀은 영국 국립보건서비스(NHS)의 수집으로 증가한 유전적 데이터를 연구해, 이미 알려진 불일치 돌연변이와의 비교로 알파미스센스의 예측 결과를 검증한다. 알피미스센스를 소개하는 연구 논문은 알파미스센스의 질병 예측 정확도는 90%, 유전적 돌연변이 분류 비율은 89%라고 주장했다.

특정 유전자 불일치 돌연변이가 질병 원인이 되었는지를 찾아내려는 연구팀은 이제 유전자 돌연변이를 정리한 표를 보고, 병원체 점수 예측 결과를 찾을 수 있다. 알파폴드가 의약품부터 암 치료제까지 모든 것을 발견하는 속도를 높였듯이 알파미스센스가 여러 분야의 연구팀의 유전자 돌연변이 연구 속도를 높여 질병 진단과 새로운 치료법도 더 빨리 발견하는 데 도움이 될 것으로 기대할 수 있다. 아브섹은 “알파미스센스의 예측 결과가 질병을 유발한 돌연변이를 추가로 깊이 분석하고, 유전학 분야의 다른 적용 사례도 제공하기를 바란다”라고 말했다.

연구팀은 알파미스센스의 예측 사항을 자체적으로 이용할 수 없다는 점을 강조했다. 대신, 현실 세계 연구에만 활용할 수 있다. 알파미스센스는 비정상적인 질병 원인을 신속하게 지목하여 연구팀이 유전자 돌연변이와 질병을 일치하게 배치하는 과정을 우선순위로 두는 데 도움을 줄 수 있다. 또한, 유전자 코드에서 간과한 영역을 더 자세히 이해하는 데도 도움을 줄 수 있다. 알파미스센스는 기본적으로 인간의 생존에 미치는 중요성의 척도를 측정한 각각의 유전자 지표를 포함한다. (인간 유전자 중 약 1/5의 역할은 분명하지 않지만, 대부분 필수인 것으로 나타났다.)

유럽 분자생물실험실(European Molecular Biology Laboratory) 부소장이자 유럽 생물정보학연구소(European Bioinformatics Institute) 공동 소장인 에완 버니(Ewan Birney)는 알파미스센스가 알파폴드만큼 획기적인 모델은 아니라고 평가했다. 유럽 생물정보학연구소는 과거, 딥마인드와 긴밀한 연구를 진행한 적이 있으나 알파미스센스 개발 연구에는 참여하지 않았다. 버니 소장은 “알파폴드가 공개되자마자 모두 알파폴드의 프레임워크를 이용하여 단백질 변화를 일으킨 돌연변이를 해석할 수 있다는 사실을 알았다”라고 말했다.

버니 소장은 의사가 유전자 상태가 의심스러운 아동을 신속히 진단하도록 도울 수 있는 특정 적용 사례에 주목했다. 버니 소장은 “이미 유전자 불일치 돌연변이가 진단되지 않은 일부 질병의 원인임이 분명하다는 사실을 알았다. 알파미스센스는 유전자 불일치 돌연변이를 평가할 더 나은 방식이다”라고 말했다. 이어, 망막에 유전자 치료제를 주입하여 치료하지 않을 시 시력 상실 원인이 되는 RPE65 유전자를 언급했다. 알파미스센스는 의사가 수천 개에 이를 수도 있는 DNA 내 다른 잠재적 유전자 돌연변이를 신속히 배제하도록 돕는다. 따라서 올바른 치료를 받는지 확신할 수 있다.

알파미스센스는 유전자 돌연변이 단 하나가 일치하지 않을 때 발생할 수 있는 영향을 해결하는 것을 넘어서 생물학계에서 AI 모델을 더 널리 활용할 수 있다는 잠재성을 나타낸다. 유전자 돌연변이가 일치하지 않는 문제 해결 목적으로 특별히 훈련을 받지 않았으나 생물학계에서 발견된 단백질 범위가 넓을수록 알파미스센스를 비롯한 AI 모델 적용 사례는 단 하나의 돌연변이를 훨씬 넘어서 인간 유전체와 유전체 표현 방식을 더 자세히 이해하는 데 도움이 될 것이다. 코리 부사장은 “알파미스센스의 기본적 요소는 알파폴드에서 파생됐다. 상당수 특징이 간혹 알파폴드에 내재했으며, 관련성이 있으나 매우 다른 유전자 돌연변이를 개괄적으로 보여줄 수 있었다”라고 설명했다.

** 위 기사는 와이어드UK(WIRED.co.uk)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

<기사원문>
DeepMind’s New AI Can Predict Genetic Diseases
이 기사를 공유합니다
RECOMMENDED