본문 바로가기
전문기술

[전문기술] 찾지 못하는 숨은 효소를 찾아낼 수 있는 인공지능 기술이 개발

by 과학 몰빵 입수 ( 과몰입) 2023. 11. 24.

[전문기술] 찾지 못하는 숨은 효소를 찾아낼 수 있는 인공지능 기술이 개발

 

 

카이스트 의생명화학공학과의 이상엽특훈교수와 UCSD  버나드펄슨 BernhardPalsson 공동연구팀은 효소기능을 빠르고정확하게 예측할 수 있는 인공지능 딥EC트랜스포머 Deep EC transformer를 개발했다. 기존에 알려지지 않은 효소를 찾아낼 수 있는 인공지능을 통해, 총 5,360개의 EC 번호를 예측할 수 있습니다. 이 기술은 유전체의 대사 네트워크를 분석하는데 필요한 핵심 기술로, 향후 친환경적인 방법으로 화학물질을 생산하는 미생물 세포공장 개발에 기여할 것으로 전망된다.

대장균은 가장 많이 연구된 생명체 중 하나이지만 아직 대장균을 구성하는 단백질의 기능에 대해 명확하게 밝혀지지 않았다. 이에 인공지능을 활용하여 아직 명확하게 밝혀진 바 없던 단백질에서 464종의 효소를 발견하였으며 이 중 3종의 단백질의 예측된 기능을 시험관 내 효소 분석 방법을 통해 검증하는 데 성공하였다

KAIST 총장 이광형은 생명화학공학과 이상엽 특훈교수와 캘리포니아대학교 샌디에이고 UCSD 생명공학과 버나드 펄슨 Bernhard Palsson 교수 공동연구팀이 단백질 서열을 활용해 해당 단백질의 효소 기능을 예측할 수 있는 인공지능 딥 ECTransformer를 개발해 빠르고 정확하게 효소 기능을 파악할 수 있는 예측 시스템을 구축했다고 24일 밝혔다

효소는 생물학적 반응을 촉매하는 단백질로서 생명체 내 존재하는 다양한 화학 반응과 이에 따라 결정되는 생명체의 대사 특성을 파악하기 위해서는 각 효소의 기능을 이해하는 것이 필수적이다 EC 번호효소 고유 번호 Enzyme Commission number는 국제생화학 및 분자 생물학연맹 International Union of Biochemistry and Molecular Biology IUBMB가 고안한 효소 기능 분류 체계로서 다양한 유기체의 대사 특성을 이해하기 위해선 게놈 서열에서 존재하는 효소의 종류와 EC 번호를 빠르게 분석할 수 있는 기술 개발이 필요하다

단백질과 효소의 기능을 예측하기 위해 인공지능을 활용하는 다양한 예측 시스템이 개발되었지만, 인공지능의 추론 과정을 직접 확인할 수 없거나 효소 서열 내 아미노산 잔기 최소 단위 수준으로 해석하지 못하는 등의 한계점이 존재했다

공동연구팀은 심층학습 기법과 단백질 상동성 분석 모듈을 활용하여 주어진 단백질의서열이 효소로 작용하는지 여부를 예측하는 인공지능 딥EC트랜스포머를 개발하였다.


이번 연구에서는 더욱 다양한 효소기능을 정확하게 예측하기 위해 단백질 서열 전체 맥락에서 효소 기능에 중요한 정보를 추출하였으며 이를 통해 효소의 EC번호를 정확하게 예측할 수 있었다. 개발된 인공지능은 총 5,360개의 EC번호를 예측할 수 있었다

공동연구팀은 한발 더 나아가 딥EC트랜스포머의 인공신경망내 정보흐름을 분석해 인공지능이 추론과정에서 효소기능에 중요한 활성부위나 보조인자결합부위등의 정보를 활용하고 있음을 밝혀냈다. 이처럼 인공지능의 블랙박스를 해석함으로써 인공지능이 학습과정에서 스스로 효소기능에 중요한 특징을 파악하고 있음을 연구팀은 확인했다

이번 논문에서 제1 저자로 참여한 한국과학기술원(KAIST) 소속 김기배 박사과정 연구원은 “딥EC트랜스포머를 이용하면 알려지지 않은 효소들의 새로운 기능을 예측하고, 이를 실험적으로 검증할 수 있다”며 “이를 통해 기존에는 알 수 없었던 생체 내 화학 반응들을 규명하는 데 기여할 수 있을 것”이라고 설명했다.

 

 

또한 이상엽 특훈교수는 “효소 기능을 빠르고 정확하게 예측하는 딥 EC 트랜스포머는 기능 유전체학의 핵심 기술로서 시스템 수준에서 전체 효소들의 기능들을 분석할 수 있게 한다”며 “이를 활용해 모든 효소 정보를 포함한 대사 네트워크를 기반으로 친환경 미생물 공장 개발을 수행할 수 있을 것”이라고 밝혔다.

 

KAIST 생명화학공학과 김기배 박사과정이 참여한 이번 논문은 국제 학술지 네이처(Nature) 誌가 발행하는 `네이처 커뮤니케이션즈(Nature Communications)'에 동료 심사를 거쳐 11월 14일 字 게재됐다. 

 

 ※ 논문명 : 트랜스포머 레이어와 딥러닝을 사용하여 효소 인코딩 유전자의 기능적 주석 달기 (Functional annotation of enzyme-encoding genes using deep learning with transformer layers

 

 ※ 저자 정보 : 김기배 (한국과학기술원, 제1 저자), 김지연 (한국과학기술원, 제2 저자), 이종언 (한국과학기술원, 제3 저자), Charles J. Norsigian (UCSD, 제4 저자), Bernhard O. Palsson (UCSD, 제5 저자) 및 이상엽(한국과학기술원, 교신저자) 포함 총 6 명

 

한편, 이번 연구는 과기정통부가 지원하는 ‘석유대체 친환경 화학기술개발사업의 ‘바이오화학산업 선도를 위한 차세대 바이오리파이너리 원천기술 개발’ 과제(과제책임자 KAIST 이상엽 특훈교수)의 지원을 받아 수행됐다.