人工智能如何助力“算”出新藥?

藥物研發(fā)過程漫長而復(fù)雜,“先導(dǎo)化合物的發(fā)現(xiàn)”是關(guān)鍵一步。面對(duì)化合物多如牛毛、靶點(diǎn)信息有限、作用機(jī)制難以明確的困境,人工智能會(huì)發(fā)揮什么樣的作用?

2024浦江創(chuàng)新論壇期間,上海國際計(jì)算生物學(xué)創(chuàng)新大賽面向業(yè)界出題:篩選出對(duì)NMDA受體亞型GluN1/GluN3A具有高活性的藥物分子。來自上??萍即髮W(xué)的GeminiMol團(tuán)隊(duì)開發(fā)了一種人工智能模型,該模型通過融合化合物的成藥性與構(gòu)象空間信息以精準(zhǔn)表征藥物分子性質(zhì),從而顯著提高藥物篩選命中率。憑借這一創(chuàng)新方法,團(tuán)隊(duì)篩選出的分子在所有參賽隊(duì)伍中活性最強(qiáng),并以總分第一的成績斬獲一等獎(jiǎng)。

“盡管人工智能帶來的變革剛起步,但它已經(jīng)顯示出巨大潛力?!鄙虾?萍即髮W(xué)研究員白芳說,傳統(tǒng)的計(jì)算生物學(xué)依賴物理模型驅(qū)動(dòng),需要將生物學(xué)現(xiàn)象抽象成數(shù)學(xué)公式,而人工智能的出現(xiàn)改變了這一局面,“即使缺乏精確的物理模型,人工智能依然可以通過‘?dāng)?shù)據(jù)驅(qū)動(dòng)’的方法,將物理或生物現(xiàn)象直接映射到所需的輸出結(jié)果。這種‘黑箱’特性使人工智能具有極高的應(yīng)用潛力,但同時(shí)也限制了模型的解釋性和可控性,因此展現(xiàn)出一種雙刃劍的性質(zhì)?!?/p>

從“大海撈針”到“對(duì)癥下藥”

為什么以NMDA受體亞型GluN1/GluN3A為題?記者采訪了解到,NMDA受體是神經(jīng)疾病的熱門藥物靶點(diǎn),與腦卒中、抑郁癥、癲癇、阿爾茨海默病、疼痛等多種疾病相關(guān)。而該受體亞型GluN1/GluN3A尚未被廣泛開發(fā),關(guān)于其蛋白結(jié)構(gòu)和小分子調(diào)節(jié)劑的信息非常匱乏。

如果把受體比作門鎖,那么藥物分子就是打開門鎖的鑰匙。在不知道鎖孔形狀的情況下尋找鑰匙,非常困難。

大賽的出題人介紹,研究人員以往普遍采用高通量生物實(shí)驗(yàn)的方法篩選藥物分子,這一過程猶如大海撈針。

計(jì)算生物學(xué)可以通過模擬和計(jì)算加快這一進(jìn)程。簡單來說,計(jì)算生物學(xué)是利用計(jì)算機(jī)技術(shù)研究生物學(xué)的交叉學(xué)科,如今深度學(xué)習(xí)等人工智能技術(shù)可通過“干實(shí)驗(yàn)”(計(jì)算模擬)先從大量化合物中篩選出潛在的藥物分子,相當(dāng)于為生物學(xué)“濕實(shí)驗(yàn)”(生物實(shí)驗(yàn))大幅縮小了范圍。

“藥物分子要發(fā)揮生物功能,與其自身多變的三維構(gòu)象和蘊(yùn)含的藥效信息密切相關(guān)。我們開發(fā)的人工智能模型GeminiMol,通過對(duì)比學(xué)習(xí)的方式將構(gòu)象空間信息融入分子表征中。與傳統(tǒng)分子表征方法相比,這種方式顯著提升了模型的表征能力和預(yù)測精度?!贝舜螖孬@一等獎(jiǎng)的GeminiMol團(tuán)隊(duì)成員王世航說,團(tuán)隊(duì)先調(diào)研了一些已知活性分子,然后在大賽主辦方提供的分子庫中尋找與已知活性分子的三維藥效構(gòu)象高度相似、二維化合物結(jié)構(gòu)不相似的新分子。

王世航表示,團(tuán)隊(duì)篩選出來的藥物分子,對(duì)NMDA受體亞型GluN1/GluN3A的活性為0.98微摩爾,這一指標(biāo)的含義是發(fā)揮出藥物的作用需要的劑量,數(shù)值越小越好。

篩選藥物分子的模型怎樣打造

二維結(jié)構(gòu)是生成分子數(shù)據(jù)的起點(diǎn),構(gòu)象空間則進(jìn)一步反映了分子在自然狀態(tài)下可能存在的動(dòng)態(tài)形態(tài)。如果兩個(gè)化合物在構(gòu)象空間上非常相似,它們可能作用于相同的疾病靶標(biāo),有相似藥效。

GeminiMol團(tuán)隊(duì)成員王林介紹,目前的分子相似性評(píng)價(jià)工具之所以有待提升,是因?yàn)槠渫魂P(guān)注分子的二維結(jié)構(gòu):“就像人們打招呼,握手和握拳的意義完全不一樣,不同手勢會(huì)產(chǎn)生不同效果,藥物分子的空間構(gòu)象也決定了其藥效。”

人工智能的學(xué)習(xí)能力可以將人的經(jīng)驗(yàn)轉(zhuǎn)化為可靠的模型。王林表示,團(tuán)隊(duì)首先花費(fèi)了大量時(shí)間對(duì)分子的構(gòu)象空間進(jìn)行采樣,并投喂給人工智能模型進(jìn)行學(xué)習(xí)。此外,團(tuán)隊(duì)通過計(jì)算分子間的構(gòu)象空間相似性形成了一系列描述符號(hào),讓模型從描述符號(hào)數(shù)據(jù)中學(xué)習(xí)評(píng)價(jià)分子相似性的能力。

速度快,是人工智能模型的優(yōu)點(diǎn)之一。以這次比賽為例,面對(duì)1800萬個(gè)化合物分子,GeminiMol模型僅用不到半個(gè)小時(shí)就完成了篩選評(píng)價(jià)。

在篩選過程中,人工智能模型還可以“集百家之長”?!拔覀兛梢酝瑫r(shí)借鑒兩三個(gè)已知活性較佳的分子,這樣得到的新分子可能兼具所有已知活性分子的藥效特征或結(jié)構(gòu)信息?!蓖趿终f。

GeminiMol團(tuán)隊(duì)指導(dǎo)老師、上??萍即髮W(xué)研究員白芳表示,計(jì)算生物學(xué)經(jīng)歷了幾十年的發(fā)展,如今迎來了從硬件到算法的顯著進(jìn)步。硬件方面,人工智能芯片、專門為計(jì)算生物學(xué)設(shè)計(jì)的高性能計(jì)算機(jī)提供了計(jì)算支持;算法方面,人工智能的第三次浪潮帶來了機(jī)器學(xué)習(xí)的飛躍,深度學(xué)習(xí)等先進(jìn)算法不僅提高了計(jì)算生物學(xué)的預(yù)測能力,還賦予了它創(chuàng)造新事物的可能性。

人工智能推動(dòng)藥物設(shè)計(jì)新范式

“人工智能賦能藥物設(shè)計(jì)的空間非常大,未來會(huì)發(fā)展得更好?!卑追冀榻B,現(xiàn)階段的人工智能模型并非全能,其帶來的變革剛起步不久,很多藥物設(shè)計(jì)任務(wù)中還需要基于物理模型的計(jì)算機(jī)輔助藥物設(shè)計(jì)方法予以輔助。

生物制藥中的問題通常是極其復(fù)雜的超高維問題,但當(dāng)前的生物實(shí)驗(yàn)數(shù)據(jù)在數(shù)量上極為有限,質(zhì)量參差不齊,并且數(shù)據(jù)之間難以對(duì)齊?!懊鎸?duì)這些高維數(shù)據(jù)的挑戰(zhàn),我們往往需要借助物理模型對(duì)科學(xué)問題進(jìn)行降維處理,以簡化問題并降低數(shù)據(jù)量的需求?!卑追急硎荆@是權(quán)宜之計(jì),雖然降低了對(duì)數(shù)據(jù)數(shù)量的依賴性,但也要付出一些準(zhǔn)確性上的代價(jià)。

以藥物設(shè)計(jì)的兩種路線為例,一種是參考有藥效活性的分子設(shè)計(jì)藥效活性更佳的新分子,這正是GeminiMol團(tuán)隊(duì)人工智能模型的思路,業(yè)界探索廣泛且成效初顯;另一種則是基于靶標(biāo)結(jié)構(gòu)來設(shè)計(jì)與其適配并強(qiáng)結(jié)合的分子,人工智能對(duì)此雖然有一些嘗試,但還不成熟。再如,業(yè)界希望讓人工智能自動(dòng)生成高活性的化合物,但生成全新化合物往往并不容易,理想與現(xiàn)實(shí)間還存在技術(shù)壁壘。

受訪者提到,計(jì)算生物學(xué)的發(fā)展表明,單一學(xué)科的知識(shí)和經(jīng)驗(yàn)已不足以應(yīng)對(duì)當(dāng)前的科研挑戰(zhàn)。GeminiMol團(tuán)隊(duì)成員田思源表示,盡管團(tuán)隊(duì)主要負(fù)責(zé)人工智能工具的開發(fā)和應(yīng)用,但驗(yàn)證環(huán)節(jié)涉及生物實(shí)驗(yàn),這表明科研人員最好能了解并掌握從上游到下游各個(gè)環(huán)節(jié)的知識(shí)。

白芳呼吁,在人才培養(yǎng)方面,盡可能早地進(jìn)行學(xué)科交叉學(xué)習(xí)和項(xiàng)目實(shí)踐,“隨著人工智能技術(shù)不斷發(fā)展,學(xué)科交叉已是大勢所趨,這種跨學(xué)科的合作和知識(shí)融合,將為解決復(fù)雜科學(xué)問題提供新的視角和方法?!?/p>

頂部