대웅제약 ‘화합물 8억종’ 전처리 거쳐 DB화… 독자적 AI 신약 시스템 결합해 비만·항암 연구에 ‘속도’
2년 준비 끝, 자체 AI 신약개발 시스템 ‘DAISY’ 구축 완료… 후보 물질 발굴에 활용 시작세상에 알려진 8억종 화합물질 모아 데이터베이스 구축, 골리앗 이긴 ‘DAVID’로 명명신약 후보물질 수 10의 60제곱 추정, AI로 신약개발 대항해 시대 열려박준석 센터장 “AI와 인간이 같이 학습하고 동반성장할 때 신약개발 성공 높아져”
대웅제약은 신약개발에 즉각 활용할 수 있는 주요 화합물 8억종의 분자 모델을 전처리를 거쳐 자체 데이터베이스화하고, 이를 재료로 신약 후보물질을 발굴해내는(Drug Discovery) 독자적 ‘AI 신약개발 시스템’까지 구축했다고 19일 밝혔다. 향후 전임상, 임상, 시판 등 신약개발(Drug Development) 전주기로 AI 활용을 확대할 계획이란 설명이다.
대웅제약은 이 같은 DB와 신약개발 시스템을 결합해 비만과 당뇨, 항암제 분야에서 주목할 만한 연구 성과를 내고 있다고 덧붙였다. 예컨대 비만과 당뇨질환 치료제 개발을 위해 자체 AI 시스템으로 두 가지 표적 단백질에 동시에 작용하는 ‘활성물질’을 발굴하고 최적화 단계에 돌입시키는데 단 두 달이 걸렸다. 대웅제약은 연구원들이 1년 넘게 고민하던 난제를 AI를 통해 해결한 사례라고 설명했다.
또 AI 시스템을 활용해 암세포 억제 효능을 보이는 활성물질을 발굴하고, 최적화를 통해 특허까지 가능한 ‘선도물질’을 확보하는데 단 6개월이 걸렸는데, 기존 방식으로 진행했을 경우 최소 1~2년 소요될 프로젝트였다는 게 대웅제약의 설명이다. 고비용, 저효율이라는 신약개발의 난제를 해결하고자 2년간 ‘AI 신약개발 시스템’ 구축에 몰입한 결과가 가시화되고 있는 것이다.
◇ 화합물 8억종 ‘다윗’ DB로 빅파마와 경쟁
대웅제약이 실제로 구매해 신약 개발에 즉각 쓰일 수 있는 8억종 화합물질(Compound)의 분자 모델 DB에 붙인 이름은 ‘다비드’(DAVID, Daewoong Advanced Virtual Database)다. 다비드(다윗)는 골리앗을 일격에 쓰러트린 성서에 등장하는 영웅이다. 신약개발 경쟁에서 AI로 글로벌 빅파마와 겨루겠다는 연구원들의 의지를 담았다.
8억종이라는 수치는 40여 년 간 대웅제약이 신약연구를 통해 확보한 화합물질과 현재 신약 개발에서 이용할 수 있는 거의 모든 화합물질의 결합체다. 단, 세계적으로 공개된 화합물질 오픈소스는 AI 신약개발을 위한 데이터로는 적합하지 않다. 복잡한 화합물질 구조에서 불필요한 정보를 분리, 제거하는 전처리 과정(Preprocessing)이 필수적이다. 대웅제약 AI 연구원들은 이 작업을 최우선으로 몰두해 AI가 활용할 수 있는 데이터로 모두 가공했다. 비로소 8억종의 화합물질에 기반한 ‘AI 신약 후보물질 탐색’이 가능하게 된 것이다.
8억종의 화합물 데이터는 AI에게 성장을 위한 자양분이다. 양질의 데이터가 확보되지 않으면 AI도 무용지물이다. 데이터베이스 구축은 AI 신약개발 경쟁에서 퀀텀 점프를 할 수 있는 발판을 마련한 것으로 대웅제약은 이제 기초공사를 마무리한 셈이다.
오늘날 연구자들은 신약 후보물질이 될 수 있는 화합물질의 수를 약 10의 60제곱 정도로 추정하고 있다. 인류가 단어로 표현할 수 있는 세계를 넘어선 미지의 수치다. 대웅제약이 확보한 화합물질 8억종은 10의 9제곱 수준이다.
이를 두고 박준석 신약Discovery센터장은 “신약 후보물질의 세계는 우주와 같은데 AI가 신약개발의 대항해 시대를 열었다고 해도 과언이 아니다”라며 “AI로 미지의 영역을 개척해나간다면 굉장히 많은 신약 후보물질과 우수한 신약을 더 빠르게 개발해 인류 건강에 지대한 공헌을 할 것”이라고 평했다.
◇ 비만, 당뇨, 항암, 단백질 분해 연구에 ‘성과’
AI 신약개발을 위한 방대한 데이터베이스를 구축한 후 대웅제약은 신약 후보물질 탐색의 첫 단계에 적용할 수 있는 ‘AIVS’(AI based Virtual Screening) 툴을 개발했다. 이 툴은 AI가 표적 단백질 대상으로 ‘활성물질’을 발굴하는 시스템으로 3D 모델링을 기반으로 다양하게 탐색할 수 있고, 동일한 화학적 특성을 지니면서 특허가 가능한 새 활성물질을 생성형 AI로 빠르게 찾을 수 있다.
이러한 데이터베이스와 툴을 기반으로 지난해 AI 신약개발 시스템 ‘데이지’(DAISY, Daewoong AI System)를 사내에 오픈했다. 이 시스템은 일종의 웹 기반 ‘AI 신약개발 포털’로서 대웅제약 연구원들은 데이지에 접속해 신규 화합물질을 발굴하고 약물성까지 빠르게 예측할 수 있다. 이른바 ADMET 연구까지 AI로 가능한 것이다. ADMET는 Absorption, Distribution, Metabolism, Excretion, Toxicity의 앞 글자를 따온 것으로 화합물질의 흡수, 분포, 대사, 배설, 독성 등 약물성을 파악하는 연구 단계다. 신약개발 초기에서 매우 중요한 단계로 이 연구가 제대로 이뤄지지 않으면 임상에서 실패하기 십상이다.
대웅제약 연구원들은 AI 신약후보 탐색 툴 ‘AIVS’를 사용하면서 불과 몇 달 만에 가시적인 성과들을 내고 있다. 비만과 당뇨, 항암제 분야의 성과 외에 단백질 분해제 개발에서도 의미 있는 성과를 도출하고 있고, 항체 설계와 안정성 평가를 동시에 진행해 연구자들의 시행착오를 획기적으로 줄이고 있다. AI를 활용한 후보물질 발굴과 설계를 통해 신약개발의 ‘시간’을 단축해가고 있는 것이다.
박 센터장은 “인간을 대체하는 기술로 AI를 바라보면 오산이다. 미지의 영역을 개척하는 인간의 동반자와 같다”라며 “딥러닝 AI가 ‘데이터’를 쌓으며 학습하고 성장하듯이 연구자도 함께 ‘인사이트’를 높이며 함께 동반성장해 나갈 때 비로소 신약개발 성공에 한 걸음 다가설 수 있다”고 강조했다.
◇ 신약개발에 평균 15년… AI 적용 땐 절반 줄어
한국보건산업진흥원 자료에 따르면 신약개발은 평균 15년이 걸리고 통상 1만여 개 후보물질 중 단 1개만이 성공한다. 연구자들이 처음 신약 후보물질을 찾는데 평균 5년이 걸리고 임상시험에 들어가는 후보물질을 추리는데 2년이 더 걸린다. 여기서 의미 있는 물질 1개를 발견하고자 임상 1상, 2상, 3상을 거치는데 6년이 추가로 걸린다. 글로벌 진출을 위해 미국 FDA 승인을 받으려면 또 2년이 걸린다. 이 긴 15년의 과정 역시 최상의 시나리오로 가정했을 때 이야기다.
식품의약품안전평가원이 지난해 11월 발간한 ‘식의약 R&D 이슈 보고서’도, 미국의 경우를 전제로 신약개발 기간 15년, 개발비용 2~3조원을 상정하고 있다. AI 기술을 적용할 경우 개발 기간은 7년, 비용은 약 6000억원으로 절감할 수 있는 것으로 이 자료는 분석했다.
<저작권자 ⓒ 더뉴스프라임, 무단 전재 및 재배포 금지>
박현아 기자 다른기사보기