它代表著科學(xué)家將廣泛使用能精確測(cè)定蛋白質(zhì)3D形狀的軟件。7月16日,總部位于英國(guó)倫敦的DeepMind公司發(fā)布了其深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)AlphaFold 2的開(kāi)源版本,并在《自然》雜志的一篇論文中描述了其方法。

理解蛋白質(zhì)的結(jié)構(gòu)有助于確定蛋白質(zhì)的功能,了解各種突變的作用。截至目前,約有10萬(wàn)個(gè)蛋白質(zhì)的結(jié)構(gòu)已經(jīng)用實(shí)驗(yàn)方法得到了解析,但這在已經(jīng)測(cè)序的數(shù)10億計(jì)的蛋白質(zhì)中只占了很小一部分。在50多年的時(shí)間里,研究人員一直嘗試根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)其折疊而成的三維結(jié)構(gòu)。然而,當(dāng)前使用的計(jì)算方法準(zhǔn)確度有限,實(shí)驗(yàn)方法對(duì)人力和時(shí)間的要求也非常高。

英國(guó),倫敦深度思維(DeepMind)公司的John Jumper、Demis Hassabis和同事描述了AlphaFold2,這是一個(gè)基于神經(jīng)網(wǎng)絡(luò)的新模型,其預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)能達(dá)到原子水平的準(zhǔn)確度,作者稱該方法達(dá)到了“前所未有的準(zhǔn)確度”。

去年5至7月,Jumper等在舉辦在第14屆“蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)關(guān)鍵評(píng)估”(CASP14)大賽中驗(yàn)證了這種方法。該比賽要求參賽團(tuán)隊(duì)根據(jù)蛋白質(zhì)的氨基酸序列解析它們的結(jié)構(gòu)。比賽用的蛋白質(zhì)會(huì)先用實(shí)驗(yàn)方法解析出來(lái),但具體結(jié)果不會(huì)公開(kāi)。

比賽中,AlphaFold2預(yù)測(cè)的大部分結(jié)構(gòu)達(dá)到了空前的準(zhǔn)確度,不僅與實(shí)驗(yàn)方法不相上下,還遠(yuǎn)超解析新蛋白質(zhì)結(jié)構(gòu)的其他方法。將實(shí)驗(yàn)方法得到的蛋白質(zhì)結(jié)構(gòu)疊加在AlphaFold2的結(jié)構(gòu)上,組成蛋白質(zhì)主鏈骨架的疊加原子之間的距離中位數(shù)(95%的覆蓋率)為0.96埃(0.096納米)。成績(jī)排第二的方法只能達(dá)到2.8埃的準(zhǔn)確度。

AlphaFold2的神經(jīng)網(wǎng)絡(luò)能在幾分鐘內(nèi)預(yù)測(cè)出一個(gè)典型蛋白質(zhì)的結(jié)構(gòu),還能預(yù)測(cè)較大蛋白質(zhì)(比如一個(gè)含有2180個(gè)氨基酸、無(wú)同源結(jié)構(gòu)的蛋白質(zhì))的結(jié)構(gòu)。該模型能根據(jù)每個(gè)氨基酸對(duì)其預(yù)測(cè)可靠性進(jìn)行精確預(yù)估,方便研究人員使用其預(yù)測(cè)結(jié)果。

作者認(rèn)為,這一精準(zhǔn)的預(yù)測(cè)算法可以讓蛋白質(zhì)結(jié)構(gòu)解析技術(shù)跟上基因組革命的發(fā)展步伐。

DeepMind創(chuàng)始人兼首席執(zhí)行官Demis Hassabis表示,去年該公司在CASP14大會(huì)上揭曉了將蛋白質(zhì)3D結(jié)構(gòu)預(yù)測(cè)精確到原子水平的全新AlphaFold系統(tǒng)后,承諾將分享其方法,為科學(xué)共同體提供廣泛、免費(fèi)的獲取途徑。

“今天我們邁出了承諾的第一步?!盚assabis說(shuō),“我們期待看到它會(huì)啟發(fā)出什么樣的其他新方法,也期待很快能和大家分享更多我們的新進(jìn)展?!?/p>

“阿爾法折疊2”實(shí)現(xiàn)開(kāi)源 將助力發(fā)更強(qiáng)大的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)-肽度TIMEDOO

機(jī)器學(xué)習(xí)軟件預(yù)測(cè)的人類白細(xì)胞介素-12蛋白與其受體結(jié)合的結(jié)構(gòu)。圖片來(lái)源:Ian Haydon,華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)醫(yī)學(xué)研究所

相關(guān)文章鏈接:

https://doi.org/10.1038/s41586-021-03819-2

來(lái)源:中國(guó)科學(xué)報(bào)