新型人工智能提升CRISPRi引導(dǎo)RNA效能預(yù)測-肽度TIMEDOO

多種CRISPR技術(shù)被用于有針對性地改變或沉默基因,抑制蛋白質(zhì)的產(chǎn)生。其中之一是CRISPRi(CRISPR干擾),它可以在不修改DNA序列的情況下阻斷基因和基因表達。與傳統(tǒng)CRISPR機制類似,引導(dǎo)RNA指導(dǎo)核酸酶(Cas)。然而,CRISPRi核酸酶結(jié)合到DNA而不進行切割,導(dǎo)致相應(yīng)基因的下調(diào)表達。CRISPRi已成為在細菌中沉默基因表達的主要技術(shù)之一。然而,設(shè)計規(guī)則仍然缺乏明確定義。

直到現(xiàn)在,預(yù)測特定基因的CRISPRi性能一直是具有挑戰(zhàn)性的。但研究人員現(xiàn)在已經(jīng)開發(fā)了一種使用數(shù)據(jù)整合和人工智能(AI)的機器學(xué)習(xí)方法,以改善未來這種預(yù)測的方法??茖W(xué)家們利用了多個全基因組CRISPRi必需性篩選的數(shù)據(jù)來訓(xùn)練機器學(xué)習(xí)方法。他們的目標(biāo)是更好地預(yù)測CRISPRi系統(tǒng)中使用的工程引導(dǎo)RNA的功效。

研究人員發(fā)現(xiàn),目標(biāo)基因的基因特異性特征對全基因組篩選中引導(dǎo)RNA的減少有顯著影響。此外,結(jié)合多個CRISPRi篩選的數(shù)據(jù)顯著提高了預(yù)測模型的準(zhǔn)確性,使引導(dǎo)RNA效能的估計更加可靠。該研究為通過預(yù)測引導(dǎo)RNA效能實現(xiàn)更有效的基因沉默策略提供了有價值的見解。

這項工作發(fā)表在《基因組生物學(xué)》雜志上,題為“通過混合效應(yīng)機器學(xué)習(xí)和數(shù)據(jù)整合改善細菌CRISPRi引導(dǎo)RNA效能的預(yù)測”。

“不幸的是,全基因組篩選只能提供關(guān)于引導(dǎo)RNA效能的間接信息。因此,我們應(yīng)用了一種新的機器學(xué)習(xí)方法,將引導(dǎo)RNA的功效與沉默基因的影響分離開來,”Würzburg RNA感染研究所(HIRI)的研究組長、Würzburg大學(xué)醫(yī)學(xué)院的副教授Lars Barquist博士解釋說。

該團隊開發(fā)了一種“混合效應(yīng)隨機森林回歸模型,提供更好的引導(dǎo)RNA效能估計”。通過這樣做,他們?yōu)槲磥淼腃RISPRi實驗建立了可理解的設(shè)計規(guī)則。研究作者通過進行一個針對細菌基因的獨立篩選驗證了他們的方法,結(jié)果顯示其預(yù)測比先前的方法更準(zhǔn)確。

“研究結(jié)果表明,我們的模型優(yōu)于現(xiàn)有方法,對特定基因的CRISPRi性能提供了更可靠的預(yù)測,”Barquist研究組的博士生Yanying Yu說。

科學(xué)家們對發(fā)現(xiàn)引導(dǎo)RNA本身并非決定CRISPRi在必需性篩選中減少的主要因素感到意外?!芭c先前的認知相比,某些與基因表達相關(guān)的基因特異性特征似乎影響更大,”Yu解釋道。

研究還表明,整合來自多個數(shù)據(jù)集的數(shù)據(jù)顯著提高了預(yù)測的準(zhǔn)確性,使引導(dǎo)RNA效能的評估更加可靠。

“通過整合多個實驗的培訓(xùn)數(shù)據(jù)是創(chuàng)建更好的預(yù)測模型的關(guān)鍵。在我們的研究之前,數(shù)據(jù)不足是預(yù)測準(zhǔn)確性的主要限制因素,”Barquist指出?!拔覀兊难芯繛殚_發(fā)更精密的工具以操縱細菌基因表達提供了藍圖,最終有助于更好地理解和對抗病原體?!?/p>

參考文獻:?“Improved prediction of bacterial CRISPRi guide efficiency from depletion screens through mixed-effect machine learning and data integration.

編輯:王洪

排版:李麗