페이지_배너

소식

올해의 라스커 기초 의학 연구상은 아미노산의 1차 서열을 기반으로 단백질의 3차원 구조를 예측하는 알파폴드 인공지능 시스템을 개발한 데 기여한 데미스 하사비스와 존 점퍼에게 수여되었습니다.

 

이들의 연구 결과는 오랫동안 과학계를 괴롭혀 온 문제를 해결하고 생물의학 분야 전반에 걸쳐 연구를 가속화할 수 있는 문을 열어줍니다. 단백질은 질병 발생에 중추적인 역할을 합니다. 알츠하이머병에서는 단백질이 접히고 뭉쳐지며, 암에서는 조절 기능을 상실합니다. 선천성 대사 장애에서는 단백질이 제대로 기능하지 않습니다. 낭포성 섬유증에서는 단백질이 세포 내 잘못된 공간으로 이동합니다. 이는 질병을 유발하는 수많은 메커니즘 중 일부에 불과합니다. 상세한 단백질 구조 모델은 원자 배열을 제공하고, 고친화도 분자의 설계 또는 선택을 촉진하며, 신약 개발을 가속화할 수 있습니다.

 

단백질 구조는 일반적으로 X선 결정학, 핵자기공명, 그리고 저온전자현미경을 통해 결정됩니다. 이러한 방법들은 비용과 시간이 많이 소요됩니다. 이로 인해 기존의 3차원 단백질 구조 데이터베이스는 약 20만 개의 구조 데이터만 가지고 있는 반면, DNA 시퀀싱 기술은 800만 개 이상의 단백질 서열을 생성했습니다. 1960년대에 Anfinsen 등은 아미노산의 1차원 서열이 자발적이고 반복적으로 기능적인 3차원 구조로 접힐 수 있으며(그림 1A), 분자 "샤페론"이 이 과정을 가속화하고 촉진할 수 있다는 것을 발견했습니다. 이러한 관찰은 분자생물학에서 60년간의 난제로 이어졌습니다. 바로 아미노산의 1차원 서열로부터 단백질의 3차원 구조를 예측하는 것입니다. 인간 게놈 프로젝트의 성공으로 1차원 아미노산 서열을 얻는 우리의 능력은 크게 향상되었고, 이 과제는 더욱 시급해졌습니다.

ST6GAL1-단백질-구조

단백질 구조를 예측하는 것은 여러 가지 이유로 어렵습니다. 첫째, 모든 아미노산에 존재하는 모든 원자의 가능한 모든 3차원적 위치를 파악하려면 많은 연구가 필요합니다. 둘째, 단백질은 화학 구조의 상보성을 최대한 활용하여 원자를 효율적으로 배열합니다. 단백질은 일반적으로 수백 개의 수소 결합 "공여체"(보통 산소)를 가지고 있으며, 이들은 수소 결합 "수용체"(보통 수소에 결합된 질소)와 가까이 위치해야 하므로, 거의 모든 공여체가 수용체와 가까이 있는 형태를 찾는 것은 매우 어려울 수 있습니다. 셋째, 실험 방법 학습을 위한 사례가 제한적이므로, 관련 단백질의 진화에 대한 정보를 사용하여 1차원 서열을 기반으로 아미노산 간의 잠재적인 3차원적 상호작용을 이해하는 것이 필요합니다.

 

물리학은 최적의 구조를 찾기 위해 원자의 상호작용을 모델링하는 데 처음 사용되었으며, 단백질의 구조를 예측하는 방법이 개발되었습니다. Karplus, Levitt, Warshel은 단백질의 계산 시뮬레이션 연구로 2013년 노벨 화학상을 수상했습니다. 그러나 물리학 기반 방법은 계산 비용이 높고 근사적 처리가 필요하기 때문에 정확한 3차원 구조를 예측할 수 없습니다. 또 다른 "지식 기반" 접근법은 알려진 구조와 서열의 데이터베이스를 사용하여 인공지능과 머신러닝(AI-ML)을 통해 모델을 학습하는 것입니다. Hassabis와 Jumper는 물리학과 AI-ML의 요소를 모두 적용하지만, 이 접근법의 혁신과 성능 향상은 주로 AI-ML에서 비롯됩니다. 두 연구원은 대규모 공공 데이터베이스와 산업용 컴퓨팅 리소스를 창의적으로 결합하여 AlphaFold를 개발했습니다.

 

그들이 구조 예측 퍼즐을 "풀었다"는 것을 어떻게 알 수 있을까요? 1994년, 구조 예측의 중요 평가(CASP) 경진대회가 시작되었는데, 이 대회는 2년마다 개최되어 구조 예측의 진행 상황을 추적합니다. 연구자들은 최근 구조를 규명했지만 아직 결과가 발표되지 않은 단백질의 1차원 서열을 공유합니다. 예측자는 이 1차원 서열을 사용하여 3차원 구조를 예측하고, 평가자는 실험자가 제공한 3차원 구조(평가자에게만 제공)와 비교하여 예측 결과의 품질을 독립적으로 평가합니다. CASP는 진정한 블라인드 검토를 실시하고 방법론적 혁신과 관련된 주기적인 성능 향상을 기록합니다. 2020년 제14회 CASP 컨퍼런스에서 AlphaFold의 예측 결과는 엄청난 성능 향상을 보여주었고, 주최측은 3차원 구조 예측 문제가 해결되었다고 발표했습니다. 대부분의 예측 정확도는 실험 측정값과 거의 비슷했습니다.

 

더 큰 의의는 하사비스와 점퍼의 연구가 AI-ML이 과학을 어떻게 변화시킬 수 있는지 설득력 있게 보여준다는 것입니다. 이들의 연구는 AI-ML이 여러 데이터 소스로부터 복잡한 과학적 가설을 구축할 수 있고, 주의 메커니즘(ChatGPT와 유사)이 데이터 소스의 핵심 종속성과 상관관계를 발견할 수 있으며, AI-ML이 출력 결과의 품질을 스스로 판단할 수 있음을 보여줍니다. AI-ML은 본질적으로 과학을 수행하는 것입니다.


게시 시간: 2023년 9월 23일