12月6日,《科學(xué)》在線發(fā)表了西湖大學(xué)生命科學(xué)學(xué)院、西湖實(shí)驗(yàn)室教授俞曉春團(tuán)隊(duì)最新成果“完整的端粒到端粒小鼠參考基因組序列”,報(bào)道了該團(tuán)隊(duì)在解析小鼠參考基因組方面取得的重要突破。這意味著人類歷史上第一次看清了小鼠基因組DNA全貌。

目前小鼠的基因“檔案”中,最完整的是參考基因組GRCm39,同樣也存在約7~8%未被解析的區(qū)域。小鼠是生命科學(xué)研究中最常見的實(shí)驗(yàn)動(dòng)物和模式生物,這是因?yàn)樵S多生物實(shí)驗(yàn)不宜在人體內(nèi)進(jìn)行,因此,小鼠的基因組DNA信息直接關(guān)系到人類健康的探索。

俞曉春團(tuán)隊(duì)綜合了眾多三代基因測(cè)序技術(shù),讓它們互相補(bǔ)足,開發(fā)了一把能夠充分挖掘小鼠基因的“金鏟子”。他們以最常用的小鼠C57BL/6的單倍體胚胎干細(xì)胞為樣本,進(jìn)行了基因測(cè)序和組裝,獲得了長(zhǎng)度為2.77 Gbp(表示十億個(gè)堿基對(duì))的完整的高質(zhì)量小鼠參考基因組序列,其中包含215.23 Mbp(表示一百萬(wàn)個(gè)堿基對(duì))先前未被鑒定的序列,填補(bǔ)了約7.7%的基因組空白。

俞曉春表示,在這項(xiàng)研究中,團(tuán)隊(duì)發(fā)現(xiàn)了新的蛋白質(zhì)編碼基因。與先前的參考基因組版本相比,本研究額外注釋了639個(gè)蛋白質(zhì)編碼基因,其中先前未被發(fā)現(xiàn)的全新的蛋白質(zhì)編碼基因有140個(gè)。這些新的蛋白質(zhì)編碼基因可能參與多種生物學(xué)過程,為未來(lái)的研究提供了新的方向。

研究較精確地“看清”了核糖體DNA的基因序列。核糖體是細(xì)胞內(nèi)的“蛋白質(zhì)工廠”,負(fù)責(zé)合成蛋白質(zhì)。核糖體DNA是細(xì)胞中的一種特殊DNA,它專門負(fù)責(zé)編碼核糖體的RNA(rRNA)——一種核糖體的重要組成部分,幫助核糖體合成蛋白。用簡(jiǎn)潔的比擬來(lái)說(shuō),核糖體DNA給出了細(xì)胞內(nèi)rRNA的“藍(lán)圖”。這個(gè)發(fā)現(xiàn)為進(jìn)一步解析核糖體潛在的蛋白質(zhì)翻譯功能的差異性提供參考。

此外,研究還解析了著絲粒區(qū)域的基因序列詳情。本研究的結(jié)果顯示,小鼠各染色體之間的著絲粒長(zhǎng)度具有明顯差異,且序列內(nèi)部富含轉(zhuǎn)座元件和片段重復(fù),同時(shí)還有散在的基因分布,表明該區(qū)域可能會(huì)進(jìn)行活躍的轉(zhuǎn)錄和轉(zhuǎn)座事件,驅(qū)動(dòng)著絲粒區(qū)域進(jìn)行適應(yīng)性改變等行為。對(duì)著絲粒區(qū)域的解析,有助于理解因著絲粒功能缺陷導(dǎo)致的染色體重排、非整倍性等相關(guān)疾病的發(fā)病機(jī)制。

西湖實(shí)驗(yàn)室助理研究員劉俊麗和李麒麟為論文共同第一作者,俞曉春為通訊作者。

相關(guān)論文信息:https://www.science.org/doi/10.1126/science.adq8191

來(lái)源:《科學(xué)》