21 天!AI新藥研發(fā)頭部公司創(chuàng)紀(jì)錄, “圖片造假術(shù)”正加速救命藥問世
從選擇一個靶點(diǎn),到形成潛在的新藥候選分子,這個過程需要多長的時間?過去的回答可能是數(shù)月,乃至數(shù)年。但在昨日,來自人工智能藥物發(fā)現(xiàn)公司Insilico Medicine、藥明康德以及多倫多大學(xué)的科學(xué)家們在《自然》子刊 Nature Biotechnology 上給出了不同的答案。他們用一種稱為生成張力強(qiáng)化學(xué)習(xí)(GENTRL)的新 AI 系統(tǒng),將這一數(shù)字縮短到了僅僅 21 天!
完成新藥候選分子設(shè)計(jì)和篩選后,GENTRL 系統(tǒng)共設(shè)計(jì)出 6 種新的 DDR1 抑制劑,并完成臨床前生物學(xué)驗(yàn)證,整個過程耗時 46 天。這一速度,要比傳統(tǒng)制藥公司的藥物研發(fā)過程,快 15 倍。在 6 種新藥候選分子中,4 種化合物在生化分析中具有活性,2 種化合物在體外細(xì)胞實(shí)驗(yàn)中展現(xiàn)了預(yù)期的 DDR1 抑制能力,其中1號化合物進(jìn)入臨床前的動物實(shí)驗(yàn)。
(來源:Nature Biotechnology)
眾所周知,新藥研發(fā)之路并非坦途。在高達(dá)近 9 成的失敗率面前,每一款上市新藥的背后,都是平均 10 多年的漫長道路,以及 20 多億美元的高昂開支。其中,光是早期藥物發(fā)現(xiàn),就占去了將近一半的成本。這項(xiàng)新的研究可能會促成新藥研發(fā)困境的改變?!斑@篇論文是我們在人工智能驅(qū)動藥物發(fā)現(xiàn)之路上的一個重要里程碑。現(xiàn)在,這項(xiàng)技術(shù)正在成為主流,當(dāng)這些模型被整合到全面的藥物發(fā)現(xiàn)管線中時,它們適用于許多靶點(diǎn),我們與領(lǐng)先的生物技術(shù)公司合作,將進(jìn)一步推動生成化學(xué)和生成生物學(xué)的極限?!闭撐耐ㄓ嵶髡?、Insilico Medicine 創(chuàng)始人兼 CEO Alex Zhavoronkov 博士表示。
Insilico Medicine 被美國知名創(chuàng)投研究機(jī)構(gòu) CB Insights 譽(yù)為2018 全球人工智能百強(qiáng)公司。值得注意的是,藥明康德與 Insilico Medicine 關(guān)系密切。后者的最近一次融資是2018年6月由藥明康德風(fēng)險(xiǎn)投資基金領(lǐng)投的戰(zhàn)略融資,從那以后,雙方開始了緊密合作。這種親密關(guān)系,也讓 Insilico Medicine 更接近中國的新藥研發(fā),隨著數(shù)千家中國制藥公司從仿制藥向創(chuàng)新藥過渡,中國的新藥研發(fā)預(yù)計(jì)會有爆發(fā)性增長,市場前景廣闊。
從靶點(diǎn)到候選分子,僅用 21 天
在這次發(fā)表的文章中,研究團(tuán)隊(duì)選擇了 DDR1 作為靶點(diǎn)。DDR1是一種在上皮細(xì)胞中表達(dá)的酪氨酸激酶,與組織纖維化疾病進(jìn)展密切相關(guān)。為了尋找到潛在的 DDR1 抑制劑,研究人員們開發(fā)了一種使用了強(qiáng)化學(xué)習(xí)技術(shù)的新 AI 系統(tǒng),初步得到大約 3 萬個不同的分子結(jié)構(gòu)。具體來看,這個算法的訓(xùn)練用到了多個不同的數(shù)據(jù)庫。其中最大的一個數(shù)據(jù)庫里包含海量的分子結(jié)構(gòu),其他的數(shù)據(jù)庫則分別為已知的 DDR1 抑制劑及其 3D 結(jié)構(gòu)、具有激酶抑制劑活性的常見分子(作為正對照)、無法靶向激酶結(jié)構(gòu)的分子(作為負(fù)對照)、以及已被醫(yī)藥企業(yè)申請專利的分子。之后,研究團(tuán)隊(duì)根據(jù)反應(yīng)基團(tuán)與化學(xué)空間等指標(biāo)對這些分子結(jié)構(gòu)進(jìn)一步篩選,并在實(shí)驗(yàn)室中合成了 6 個潛在新藥分子。經(jīng)過初步生化測試,研究人員篩選出 4 個具有活性的潛在分子進(jìn)入體外細(xì)胞實(shí)驗(yàn)。而在體外實(shí)驗(yàn)中,結(jié)果顯示其中 2 個化合物對于 DDR1 具有抑制性,展現(xiàn)了顯著的 DDR1 抑制能力,且能有效降低與纖維化進(jìn)程有關(guān)的標(biāo)志物。
圖 | AI系統(tǒng)設(shè)計(jì)篩選全新DDR1激酶抑制劑流程(來源:Insilico Medicine)
減少研發(fā)周期和總成本,對藥物研發(fā)的未來至關(guān)重要。在這些最新成果中,Insilicon 強(qiáng)調(diào)了一種基于人工智能的新技術(shù)(GAN-RL),該技術(shù)使他們能夠在很短的時間內(nèi)在動物模型中篩選出有效的潛在藥物分子。如果這項(xiàng)技術(shù)被廣泛證明是有用的,它很可能在未來的藥物研發(fā)中具有轉(zhuǎn)化潛力?!备唿c(diǎn)大學(xué)(High Point University)藥學(xué)院兼職教授 Stevan Djuric 說道。從最初的靶點(diǎn)確定,到完成潛在新藥分子結(jié)構(gòu)篩選,僅用時 21 天;而到完成初步的生物學(xué)驗(yàn)證,用時僅 46 天。在之后的體內(nèi)動物實(shí)驗(yàn)中,篩選出的新藥分子的藥代動力學(xué)特征均達(dá)到預(yù)期結(jié)果。此外,科學(xué)家們也決定公開該算法的源代碼,供產(chǎn)業(yè)更多研發(fā)人員使用。2013 年諾貝爾化學(xué)獎得主、斯坦福大學(xué)結(jié)構(gòu)生物學(xué)教授 Michael Levitt 評價(jià)道,“這篇論文無疑是一個令人印象深刻的進(jìn)步,很可能適用于藥物設(shè)計(jì)中的許多其他問題。基于最先進(jìn)的強(qiáng)化學(xué)習(xí),我也對這項(xiàng)研究的廣度印象深刻,因?yàn)樗婕暗椒肿咏?、親和度測量和動物研究?!?/p>
AI直擊藥物研發(fā)痛點(diǎn)
藥物和作用靶點(diǎn)就如同鑰匙和鎖的關(guān)系。在藥物研發(fā)過程中,選擇和確定有效的藥物靶點(diǎn)也是新藥開發(fā)的首要任務(wù)。確定靶點(diǎn)之后,通過研究靶標(biāo)生物大分子的結(jié)構(gòu)、構(gòu)效關(guān)系進(jìn)行藥物分子的篩選和設(shè)計(jì),尋找適合這把鎖的鑰匙,至關(guān)重要。大多數(shù)情況下,科學(xué)家只能通過不斷擴(kuò)大篩選對象,在自然界無數(shù)種物質(zhì)中苦苦尋覓一種能有效結(jié)合靶點(diǎn)的“鑰匙”。這一過程,即使是利用由機(jī)器自動完成的高通量篩選(HTS)進(jìn)行試驗(yàn),也往往耗時耗力,就如同在黑夜里蒙著眼睛開槍打靶。在傳統(tǒng)藥物研發(fā)過程中,需要經(jīng)過尋找靶點(diǎn)、篩選先導(dǎo)化合物、臨床前動物實(shí)驗(yàn)、臨床試驗(yàn)等過程。一款新藥的誕生,往往意味著無數(shù)科學(xué)家十多年的時間、數(shù)十億美元的資金投入,更重要的是這一過程中失敗率極高。2015年,F(xiàn)DA報(bào)告了 60 種獲批藥物,每種獲批藥物的研發(fā)成本平均高達(dá) 6.98 億美元,并且有將近 420 億美元用在了失敗藥物研發(fā)上。在傳統(tǒng)藥物研發(fā)過程中,對數(shù)千個小分子的測試,最終只為尋找?guī)讉€有希望的候選分子,而這些分子中只有大約十分之一能夠進(jìn)入臨床試驗(yàn)。不僅如此,傳統(tǒng)藥物的研發(fā),越來越難以取得突破,這是因?yàn)榇蠖鄶?shù)可以被使用的化合物已經(jīng)被發(fā)現(xiàn),新的化合物開發(fā)難度逐漸加大,另一方面則是由于科學(xué)成果的數(shù)量增長速度很快,人類個體不可能完全理解這些數(shù)據(jù)。
(來源:Pixabay)
而 AI 技術(shù)的出現(xiàn)和發(fā)展,為解決藥物研發(fā)痛點(diǎn),提供了新的希望。人工智能可以從海量論文中攝取所需的分子結(jié)構(gòu)等信息,并且可以自主學(xué)習(xí),建立其中的關(guān)聯(lián)??梢韵胂螅词乖诎l(fā)現(xiàn)新藥的時間上,或是成功的可能性上有一個微小的改進(jìn),也將給藥企帶來顯著的成本優(yōu)勢,并為病人帶來諸多福利。微軟和谷歌前高管、創(chuàng)新工場創(chuàng)始人李開復(fù)博士表示,“本文提出的生成張力強(qiáng)化學(xué)習(xí)方法大大提高了生物化學(xué)在藥物發(fā)現(xiàn)中的應(yīng)用效率。雖然這種方法還有待進(jìn)一步的大規(guī)模實(shí)驗(yàn),但已經(jīng)標(biāo)志著 AI 制藥在產(chǎn)業(yè)層面的突破,可能會給我們帶來重大的社會和經(jīng)濟(jì)影響。”
里程碑,也是新起點(diǎn)
去年12月, DeepMind 首次推出 AlphaFold ,這是一種預(yù)測蛋白質(zhì)折疊的算法。它輕而易舉地?fù)魯×酥扑幮袠I(yè)長期以來的競爭對手,盡管如此,一些專家仍然懷疑人工智能是否能夠創(chuàng)造出既有效又真正實(shí)用的分子。
目前的市場上也還沒有出現(xiàn)人工智能生產(chǎn)的藥物。像 AlphaFold 這樣的系統(tǒng)雖然炫酷,能展示很多令研究人員興奮的前沿技術(shù),但是卻不太可能產(chǎn)生可以迅速轉(zhuǎn)化為新藥的結(jié)果。
今年 4 月,一項(xiàng)重要的藥物 AI 項(xiàng)目折戟,IBM 停止銷售其藥物 AI 工具“沃森藥物發(fā)現(xiàn)系統(tǒng)”(Watson for Drug Discovery),該系統(tǒng)曾設(shè)想被用來搜索醫(yī)學(xué)文獻(xiàn)和基因數(shù)據(jù)以尋找被人類忽視的治療方法。有報(bào)道稱,該系統(tǒng)并不能實(shí)現(xiàn)對其首批客戶的預(yù)期交付。
盡管 AI 藥物研發(fā)項(xiàng)目屢屢失敗,但投資者仍在奮力前行。有數(shù)據(jù)顯示,去年有超過 10 億美元的資金涌入人工智能藥物研發(fā)初創(chuàng)企業(yè),制藥行業(yè)也開始關(guān)注人工智能藥物的研發(fā)。
斯坦福大學(xué)孵化的 Insitro 公司于今年 4 月與吉利德科學(xué)公司簽署了一項(xiàng)協(xié)議,開發(fā)針對肝臟疾病的藥物分子,包括稅費(fèi)在內(nèi)項(xiàng)目價(jià)值高達(dá) 10 億美元。同月,英國初創(chuàng)公司 Exscientia 宣布,該公司已生產(chǎn)出一種有望治療慢性阻塞性肺病(COPD)的分子,即將與葛蘭素史克(GSK)進(jìn)行臨床試驗(yàn)。
Insilico 的方法基于兩種形式的人工智能:生成對抗網(wǎng)絡(luò)(GAN,該技術(shù)最初作為一種以假亂真的圖片生成技術(shù)進(jìn)入大眾視野)和強(qiáng)化學(xué)習(xí)。它通過查找過去的研究和專利,發(fā)現(xiàn)其中對特定的藥物靶點(diǎn)和其他結(jié)構(gòu)有效的分子結(jié)構(gòu)。查找的思路是優(yōu)先考慮最新的、合乎邏輯的、可以在實(shí)驗(yàn)室合成的分子結(jié)構(gòu)。這和藥物化學(xué)家在閱讀文獻(xiàn)和拼湊分子成分時所做的事情是一樣的。
圖 | 生成張力強(qiáng)化學(xué)習(xí)模型(來源:Insilico Medicine)
人類基因組計(jì)劃首席科學(xué)家、波士頓大學(xué)教授 Charles Cantor 表示,“關(guān)于人工智能 AI 在改善醫(yī)療保健和開發(fā)新醫(yī)療工具方面的前景,存在著許多夸張的說法。然而,最近發(fā)表在 Nature Biotechnology 上的這篇論文確實(shí)具有重要意義,原因有二,一是人工智能取代了通常由藥物化學(xué)家扮演的角色,二是藥物開發(fā)速度的加快,意味著專利覆蓋范圍的延長,從而提高了藥物開發(fā)的經(jīng)濟(jì)性。如果這種方法可以推廣,它將成為制藥工業(yè)中廣泛采用的方法?!惫鸫髮W(xué)系統(tǒng)生物學(xué)家 Mohammed AlQuraishi 表示,即使算法還不能戰(zhàn)勝化學(xué)家團(tuán)隊(duì),但是這個研究證實(shí)了 AI 是可以快速挖掘出有用的線索,并引導(dǎo)人類研究者去探索的。這仍然是一個起點(diǎn)。
-End-
參考:
https://www.nature.com/articles/s41587-019-0224-x
https://www.eurekalert.org/pub_releases/2019-09/im-nmd083019.php
https://www.drugtargetreview.com/news/48404/ai-designed-synthesised-and-validated-new-drug-in-46-days/
https://www.wired.com/story/molecule-designed-ai-exhibits-druglike-qualities/
來源:DeepTech

