制藥行業(yè)又添互聯(lián)網(wǎng)新玩家,騰訊首個(gè)AI“智藥”平臺(tái)上線
隨著 AI 向各行各業(yè)逐漸深入地滲透,“AI + 醫(yī)療”近年來(lái)在健康管理、醫(yī)學(xué)影像、輔助診斷等應(yīng)用場(chǎng)景方面取得了不少進(jìn)展,而極具技術(shù)壁壘的新藥研發(fā)場(chǎng)景仍然還是一片藍(lán)海,由此也博得了產(chǎn)業(yè)界和資本界的高度關(guān)注。
目前,“AI + 新藥研發(fā)”的入局者主要有兩類:一類是以 Insilico Medicine、Atomwise 等為代表的初創(chuàng)企業(yè),團(tuán)隊(duì)以生物計(jì)算交叉背景居多,發(fā)展勢(shì)頭強(qiáng)勁;另一類是已經(jīng)具備先進(jìn)的 AI 技術(shù)能力,后向醫(yī)學(xué)領(lǐng)域溢出的互聯(lián)網(wǎng)科技公司,比如谷歌和賽諾菲聯(lián)合推出藥物研發(fā)虛擬創(chuàng)新實(shí)驗(yàn)室,微軟宣布與諾華進(jìn)行為期 5 年的 “AI + 藥物研發(fā)” 合作。
在國(guó)內(nèi),騰訊也加入了這一行列,此前,騰訊曾多輪投資做藥物晶型預(yù)測(cè)的晶泰科技。本月初,騰訊首席運(yùn)營(yíng)官任宇昕在 “世界人工智能大會(huì) 2020 云端峰會(huì)” 對(duì)外宣布進(jìn)軍 “AI + 新藥研發(fā)” 領(lǐng)域,其自主研發(fā)的 AI 藥物發(fā)現(xiàn)平臺(tái) “云深智藥(iDrug)” 正式亮相。
兩個(gè)模塊已開放使用
“云深智藥” 緣起于 “只在此山中,云深不知處”, 道出了新藥研發(fā)的復(fù)雜過(guò)程。眾所周知,新藥研發(fā)周期一般為 14 年,研發(fā)費(fèi)用超過(guò) 10 億美元,且研發(fā)成功率低,原研化藥研發(fā)成功率約 6%。
圖 | “云深智藥”藥物發(fā)現(xiàn)平臺(tái)(來(lái)源:“云深智藥”官網(wǎng))
“云深智藥”是一個(gè)小分子藥物發(fā)現(xiàn)平臺(tái),其功能模塊覆蓋臨床前新藥發(fā)現(xiàn)的全流程,包括蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、虛擬篩選、分子設(shè)計(jì) / 生成、ADMET 預(yù)測(cè)及合成路線規(guī)劃五大模塊。平臺(tái)已于 7 月 8 日上線虛擬篩選和 ADMET 性質(zhì)預(yù)測(cè)兩個(gè)模塊,供用戶免費(fèi)使用;蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、分子設(shè)計(jì) / 優(yōu)化、合成路線規(guī)劃等模塊將陸續(xù)在年內(nèi)上線。官方稱,除了能夠免費(fèi)使用平臺(tái)搭載的核心功能外,藥企、科研機(jī)構(gòu)還可以與騰訊共同開發(fā)定制化的 AI 工具。
圖 | “云深智藥”五大模塊,目前虛擬篩選和 ADMET 性質(zhì)預(yù)測(cè)兩個(gè)模塊已開放上線,供用戶免費(fèi)使用 (來(lái)源:“云深智藥”官網(wǎng))
騰訊告訴生輝,目前 “云深智藥” 平臺(tái)上已經(jīng)在運(yùn)行十個(gè)左右研發(fā)項(xiàng)目,包括篩選抗新冠病毒藥物的相關(guān)研究等。其合作伙伴主要包括高校等科研機(jī)構(gòu)和醫(yī)藥研發(fā)企業(yè)(包括國(guó)內(nèi)外知名藥企)。
“云深智藥”是騰訊以 AI 技術(shù)賦能藥物發(fā)現(xiàn)的首個(gè)產(chǎn)品,由騰訊 AI Lab 打造。騰訊 AI Lab 于 2017 年開始 “AI + 醫(yī)療” 探索,從影像篩查、病理診斷、再到 2019 年初啟動(dòng)了藥物研發(fā)項(xiàng)目。今年 7 月 21 日,騰訊對(duì)外披露了其在醫(yī)療健康領(lǐng)域的最新進(jìn)展。鐘南山院士團(tuán)隊(duì)與騰訊 AI Lab 聯(lián)合發(fā)布了一項(xiàng)利用 AI 預(yù)測(cè) COVID-19 患者病情發(fā)展至危重概率的研究成果,可分別預(yù)測(cè) 5 天、10 天和 30 天內(nèi)病情危重的概率,有助合理地為病人進(jìn)行早期分診。
當(dāng)被問(wèn)及緣何加入 “AI + 新藥研發(fā)” 領(lǐng)域,騰訊回答:“數(shù)字化、智能化的藥物研發(fā)方法已展示出重要的潛力和價(jià)值;同時(shí),在 “AI + 醫(yī)療” 領(lǐng)域,騰訊已經(jīng)積累了一定的前沿算法、數(shù)據(jù)庫(kù)優(yōu)化和計(jì)算資源上的優(yōu)勢(shì),希望通過(guò)整合自身的研究能力與應(yīng)用經(jīng)驗(yàn),打造 AI 驅(qū)動(dòng)的新藥研發(fā)平臺(tái),用技術(shù)助力藥企與科研機(jī)構(gòu),縮短藥物研發(fā)周期,提高藥物研發(fā)流程的效率和準(zhǔn)確率。”
“AI + 新藥研發(fā)”是一個(gè)交叉學(xué)科領(lǐng)域,只有精深的 AI 技術(shù)遠(yuǎn)遠(yuǎn)不夠,生物學(xué)以及物理化學(xué)等知識(shí)體系與藥物發(fā)現(xiàn)平臺(tái)息息相關(guān)。對(duì)此,騰訊向生輝透露了其團(tuán)隊(duì)構(gòu)成,其團(tuán)隊(duì)成員包括來(lái)自頂級(jí)科研機(jī)構(gòu)和知名藥企的生物醫(yī)藥專家,和國(guó)內(nèi)外一流高校的 AI 算法科學(xué)家(以 AI 相關(guān)專業(yè)博士為主),以及平臺(tái)系統(tǒng)技術(shù)開發(fā)工程師。
平臺(tái)優(yōu)勢(shì)
騰訊稱:“該平臺(tái)的一大優(yōu)勢(shì)在于各功能模塊為用戶提供騰訊自研的創(chuàng)新算法,其算法準(zhǔn)確度達(dá)到國(guó)際領(lǐng)先水平,能更高效率、高質(zhì)量地完成研發(fā)任務(wù)。比如在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)模塊,平臺(tái)的自研算法在國(guó)際權(quán)威的 CAMEO 大賽中獲得驗(yàn)證,比分大幅超越其他頂級(jí)學(xué)界與企業(yè)隊(duì),保持了月度及周度冠軍。在藥物虛擬篩選和 ADMET 性質(zhì)預(yù)測(cè)上,平臺(tái)的自研算法也在多個(gè)公開數(shù)據(jù)集上取得了較高精確度、突破了業(yè)界標(biāo)準(zhǔn)。還提供數(shù)據(jù)庫(kù) – 算法 – 算力一體化服務(wù),藥企、科研機(jī)構(gòu)登錄平臺(tái)即可開展研究,不需要再自行部署計(jì)算資源,從而能快速地將 AI 能力引入現(xiàn)有的研發(fā)流程中?!?/p>
CAMEO 平臺(tái)提供蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、三維蛋白質(zhì)結(jié)構(gòu)質(zhì)量評(píng)估和氨基酸殘基接觸預(yù)測(cè)評(píng)估,采用由蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)社區(qū)制定的質(zhì)量評(píng)估標(biāo)準(zhǔn)。它是全球預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)領(lǐng)域最權(quán)威的測(cè)試平臺(tái),也是全球唯一的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)自動(dòng)評(píng)估平臺(tái)。在與包含華盛頓大學(xué)、密歇根大學(xué)在內(nèi)的 35 支頂級(jí)學(xué)界與企業(yè)隊(duì)的較量中,“云深智藥”在半年內(nèi)奪得五次月度冠軍。
圖 | 騰訊算法測(cè)評(píng)(來(lái)源:https://cloud.tencent.com/developer/article/1658085)
根據(jù)騰訊的介紹以及平臺(tái)官網(wǎng)數(shù)據(jù),以 “云深智藥” 已開放的虛擬篩選模塊為例,其具體功能是:
基于配體的藥物設(shè)計(jì)方法(ligand-based drug design,LBDD)是虛擬篩選的常見(jiàn)方法之一,指的是從已知有活性的配體小分子結(jié)構(gòu)出發(fā),學(xué)習(xí)和建立分子結(jié)構(gòu)與活性之間關(guān)系的模型,用來(lái)預(yù)測(cè)新化合物的活性,適用于在靶點(diǎn)和晶體結(jié)構(gòu)不明確的情況下篩選分子。目前,該模塊支持對(duì) 920 個(gè)蛋白質(zhì)靶點(diǎn)相關(guān)的 2224 個(gè)生物測(cè)試實(shí)驗(yàn)進(jìn)行活性預(yù)測(cè)和分子篩選。
具體使用流程是:
第一步,在不知道 Assay ID 的情況下,通過(guò)靶點(diǎn)選擇相關(guān) Assay,輸入靶點(diǎn)后再勾選相關(guān)的 Assay ID;在知道 Assay ID 的情況下,通過(guò)直接指定的方式選擇 Assay ID 列表,點(diǎn)擊 “Assay” 選項(xiàng)輸入 Assay ID,系統(tǒng)會(huì)根據(jù)輸入的前綴給出相關(guān)候選 Assay ID;
第二步,選擇 Safety Panel Assay;
第三步,選擇 Kinase 相關(guān) Assay;
第四步,選擇分子庫(kù);
第五步,設(shè)置好上述參數(shù)以后,點(diǎn)擊提交任務(wù);
第六步,查詢?nèi)蝿?wù)結(jié)果,點(diǎn)擊歷史記錄按鈕,并以 csv 文件的格式導(dǎo)出。
圖 | 基于配體的藥物設(shè)計(jì)方法操作流程(來(lái)源:“云深智藥”官網(wǎng))
平臺(tái)開放的另一個(gè)模塊,ADMET 性質(zhì)預(yù)測(cè),指的是對(duì)藥物的吸收、分布、代謝、排泄和毒性性質(zhì)的全面研究,藥物早期的 ADMET 性質(zhì)預(yù)測(cè)可以明顯提高藥物研發(fā)的成功率。目前,ADMET 模塊已經(jīng)上線了 50 個(gè)模型(包括 12 個(gè)基本理化性質(zhì)和 38 個(gè) ADMET 性質(zhì))。通常,計(jì)算 100 個(gè)分子需要大約 3 分鐘。
具體操作流程是:
第一步通過(guò)分子式編輯器、SMILES 表達(dá)式和上傳分子式文件等方式輸入數(shù)據(jù);
第二步,輸入數(shù)據(jù)后,會(huì)顯示預(yù)測(cè)結(jié)果(主要包括 3 個(gè)部分即分子結(jié)構(gòu)圖、基礎(chǔ)屬性和 ADMET 屬性),然后把預(yù)測(cè)結(jié)果保存為 csv 格式導(dǎo)出;
第三步,用戶可以查詢歷史記錄;
第四步,查看 ADMET 屬性。
圖 | ADMET 預(yù)測(cè)流程(來(lái)源:“云深智藥”官網(wǎng))
數(shù)據(jù)及可解釋性問(wèn)題帶來(lái)的挑戰(zhàn)
雖然 AI 技術(shù)通過(guò)深度學(xué)習(xí)算法,加快新藥研發(fā)進(jìn)程,但是也存在著一系列局限性。比如說(shuō) AI 對(duì)數(shù)據(jù)樣本依賴大(但是很多數(shù)據(jù)掌握在藥廠和醫(yī)院手中)以及預(yù)測(cè)指標(biāo)單一,這些往往是藥物發(fā)現(xiàn)的重要制約條件。當(dāng)前,國(guó)內(nèi) “AI + 新藥研發(fā)” 起步相對(duì)較晚,研發(fā)周期相對(duì)較長(zhǎng),加上算法需要大量的數(shù)據(jù)積累,短期之內(nèi)企業(yè)難以盈利。目前,還沒(méi)有一家 AI 藥物研發(fā)的成功案例,也還沒(méi)有一款 AI 研發(fā)的藥物被批準(zhǔn)上市。此外,傳統(tǒng)醫(yī)藥行業(yè)對(duì)于 AI 驅(qū)動(dòng)藥物研發(fā)也不乏質(zhì)疑之聲,這些都為 “AI + 新藥研發(fā)” 增添了一抹不確定性。
談及如何克服 AI 存在的局限性,騰訊認(rèn)為:“‘云深智藥’平臺(tái)使用的分子大數(shù)據(jù),基于現(xiàn)有公開數(shù)據(jù)集,且進(jìn)行了多個(gè)環(huán)節(jié)的精細(xì)清洗整理工作,得到可以用于直接構(gòu)建深度學(xué)習(xí)模型的藥物分子大數(shù)據(jù)集,從而幫助用戶解決了數(shù)據(jù)難以對(duì)齊、字段缺失較多、總體質(zhì)量不佳等開源數(shù)據(jù)集的常見(jiàn)問(wèn)題。此外,平臺(tái)還可提供本地版本等靈活的部署形式,藥物企業(yè)和研究機(jī)構(gòu)利用自有數(shù)據(jù)開展研究,數(shù)據(jù)安全能得到有效保障?!?/p>
“從目前情況來(lái)看,藥物研發(fā)行業(yè)既希望 AI 能幫助改變藥物研發(fā)的漫長(zhǎng)過(guò)程和低成功率,也要求此類工具能充分驗(yàn)證自身能力并提供可解釋性?!粕钪撬帯脚_(tái)很重視 AI 的可解釋性問(wèn)題。比如在在分子屬性預(yù)測(cè)問(wèn)題上,模型缺可解釋性就是一大挑戰(zhàn)。該平臺(tái)的 ADMET 模塊,可以在精確預(yù)測(cè)分子屬性的同時(shí),給出模型預(yù)測(cè)的依據(jù),提高模型的可信度?!?騰訊補(bǔ)充道。
AI 畢竟不是魔法,無(wú)法點(diǎn)石成金?!癆I + 新藥研發(fā)”亦是如此,還需要長(zhǎng)期的沉淀。騰訊此番入局 “AI + 新藥研發(fā)” 能否幫助找到“云深之處”,同樣也需要時(shí)間來(lái)證明。
來(lái)源:麻省理工科技評(píng)論


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。