Science:用于研究語言的算法可預(yù)測SARS-CoV-2和其它病毒的“逃逸”突變
通過彌合人類語言和病毒演化間的概念鴻溝,研究人員開發(fā)出了一種功能強(qiáng)大的新型工具,它能用來預(yù)測允許病毒“逃脫”人類免疫或疫苗的突變。它的應(yīng)用可避免目前需要用高通量實(shí)驗(yàn)技術(shù)來發(fā)現(xiàn)允許病毒躲避識(shí)別的潛在突變。
Yoo-Ah Kim和Teresa Przytycka在相關(guān)的《視角》中寫道:“這些作者發(fā)現(xiàn)了病毒及其被宿主免疫系統(tǒng)的解讀與自然語言中的句子及其被人類解讀屬性之間的相似處?!?/p>
病毒有時(shí)會(huì)以旨在令其能逃避人體免疫系統(tǒng)并引起感染的方式突變,它也被稱為病毒逃逸。病毒的這一能力是疫苗和抗病毒藥物開發(fā)中的重大挑戰(zhàn),它尤其體現(xiàn)在創(chuàng)制通用型流感疫苗和HIV有效療法之中。此外,病毒逃逸已迅速成為在爭競SARS-CoV-2感染解決方案中的緊迫問題。
盡管對支配逃逸突變演變規(guī)則的了解可為治療設(shè)計(jì)提供信息,但目前用于識(shí)別潛在逃逸突變的技術(shù)仍然有限。受語法(或句法)和含義(或語義)等語言學(xué)概念的啟發(fā),Brian Hie和同事應(yīng)用自然語言處理(最初是為了訓(xùn)練計(jì)算機(jī)使用一系列單詞來理解人類語言而開發(fā)的一種機(jī)器學(xué)習(xí)技術(shù))來預(yù)測可能導(dǎo)致病毒利用氨基酸序列改變而逃逸的突變。
與單詞更改如何可以令句子保持語法正確但又能改變其含義類似,Hie等人證明,病毒如何能通過保持生物學(xué)“句法”正確的突變而實(shí)現(xiàn)免疫逃避;該“句法”控制著病毒的感染能力但又改變了病毒的“語義”,從而令中和抗體不再能識(shí)別該病毒。
根據(jù)這些結(jié)果,針對甲型流感、HIV-1和SARS-CoV-2蛋白所研發(fā)的不同語言模型可準(zhǔn)確預(yù)測有因果關(guān)系的逃逸突變,確定具高潛力逃逸的結(jié)構(gòu)區(qū)域。這些模型無需事先培訓(xùn)且僅用原始序列數(shù)據(jù)就能取得這些結(jié)果。他們發(fā)現(xiàn),對SARS-CoV-2而言,刺突蛋白(即病毒感染細(xì)胞所用蛋白)中的逃逸潛能在兩個(gè)結(jié)構(gòu)域中呈顯著富集,但在另一結(jié)構(gòu)域中卻大量減少。
來源:EurekAlert中文


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。