2024年10月16日,北京華大生命科學(xué)研究院最新成果以封面文章形式發(fā)表于Cell Systems。該成果介紹了時空轉(zhuǎn)錄組去噪算法SpotGF,闡釋了這套算法如何識別并過濾噪聲基因,有效降低時空組數(shù)據(jù)中的噪聲,并避免新的假陽性信號。
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOOCell Systems官網(wǎng)截圖
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOO
Cell Systems10月封面
理想情況下,基因表達(dá)應(yīng)在其原位被捕獲。華大自主研發(fā)的時空組學(xué)技術(shù)(Stereo-seq)就是一種結(jié)合了基因表達(dá)信息與細(xì)胞空間位置的空間轉(zhuǎn)錄組技術(shù),能夠幫助科研人員探究基因表達(dá)在組織和器官中的空間分布。
但在實際操作中,不同細(xì)胞類型的差異、實驗環(huán)境中難以預(yù)測的分子熱運動、建庫過程中的反轉(zhuǎn)錄和擴增步驟、數(shù)據(jù)分析中參數(shù)和算法的不當(dāng)使用等情況都有可能增加噪聲或假陽性的信號。
因此,開發(fā)高效的去噪算法來獲取準(zhǔn)確的空間轉(zhuǎn)錄組數(shù)據(jù),對于后續(xù)生物學(xué)問題的解讀至關(guān)重要。
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOO
SpotGF去噪算法技術(shù)原理及應(yīng)用
為此,研究團(tuán)隊開發(fā)了SpotGF去噪算法,算法基于最優(yōu)傳輸理論,定量分析了每個基因表達(dá)的擴散程度,從而準(zhǔn)確識別并過濾那些因擴散而變得無效的基因,這些無效基因通常無法為生物信息學(xué)分析提供價值。
與以往依賴數(shù)學(xué)統(tǒng)計模型來調(diào)整原始基因表達(dá)量的去噪方法不同,SpotGF在去除無效基因的同時,保留了有效基因的原始表達(dá),從而避免引入新的假陽性信號,提高了分析的準(zhǔn)確性。
華大去噪算法登Cell子刊封面!助力獲取高質(zhì)量時空轉(zhuǎn)錄組數(shù)據(jù)-肽度TIMEDOOSpotGF與現(xiàn)有去噪算法在大豆根尖Stereo-seq數(shù)據(jù)中的性能比較
SpotGF適用于多種生物信息學(xué)框架,研究人員還將其與目前廣泛使用的去噪算法如Magic、SpotClean、Sprod等進(jìn)行了比較。結(jié)果表明,在各項指標(biāo)上SpotGF均展現(xiàn)出了更優(yōu)越的性能,并顯著提升了包括Stereo-seq在內(nèi)的一系列空間轉(zhuǎn)錄組數(shù)據(jù)的聚類效果,更準(zhǔn)確地鑒定出了細(xì)胞類型的特征基因。
如何獲取高質(zhì)量的空間轉(zhuǎn)錄組數(shù)據(jù)一直是研究人員面臨的挑戰(zhàn)。SpotGF算法通過精準(zhǔn)去除數(shù)據(jù)中的噪聲,顯著提高了空間轉(zhuǎn)錄組數(shù)據(jù)的信噪比,使得細(xì)胞聚類、細(xì)胞類型注釋和差異表達(dá)等分析結(jié)果更加精確。這為理解復(fù)雜生物系統(tǒng)中的基因調(diào)控網(wǎng)絡(luò)、信號傳導(dǎo)途徑,以及細(xì)胞間的相互作用提供了強有力的工具。
北京華大生命科學(xué)研究院2021級國科大直博生杜琳為論文的第一作者,北京華大生命科學(xué)研究院的孫海汐和張博涵為論文的共同通訊作者。該研究得到了國家重點研發(fā)計劃的資助。該研究依托深圳國家基因庫完成全部生物信息學(xué)數(shù)據(jù)分析,原始測序數(shù)據(jù)存儲于國家基因庫序列歸檔系統(tǒng)CNSA。編輯:李麗