華南農業(yè)大學園藝學院教授夏瑞團隊在國家自然科學基金等項目的資助下,開發(fā)了一種基于基因共線性進行物種基因組基因結構注釋矯正的工具——SynGAP(Synteny-based Gene structure Annotation Polisher)。相關成果近日在線發(fā)表于《基因組生物學》(Genome Biology)。

學者開發(fā)出基因結構注釋“拋光”工具-肽度TIMEDOO

SynGAP基因結構注釋矯正的設計邏輯與流程。研究團隊 供圖

演化過程中,在具有共同祖先的近緣物種之間,染色體上同源基因存在保守排列的現(xiàn)象,被稱為基因共線性。近緣物種的基因共線性區(qū)塊中,部分基因丟失了與其對應的共線性基因,進而在區(qū)塊內形成共線性對的間隔。共線性基因的缺失,可能由基因組序列的變化引起的,同時還有可能是錯誤注釋或缺失的基因模型導致的。

基于后一種可能性,夏瑞團隊通過兩物種的共線性分析,檢測出共線性區(qū)塊中共線性對的空缺位置。隨后進行雙向的同源比對以實現(xiàn)對間隔內潛在注釋錯漏的初步鑒定與矯正。再通過去冗余、可靠性指標計算篩選、參考注釋質量分級等步驟對初步矯正結果進行質控,最終獲得兩物種的高質量矯正注釋,并且實現(xiàn)對間隔的填補。

論文第一作者、華南農業(yè)大學園藝學院博士研究生吳鋒琦表示,通過多個植物、動物物種組合的測試與統(tǒng)計,明確SynGAP可以對被測試基因組基因結構注釋進行優(yōu)化——增加優(yōu)質新基因注釋以及共線性基因對,同時提高了BUSCO完整度。

除了基因結構注釋矯正功能模塊外,SynGAP還包含了一套物種間比較轉錄組分析流程。通過該流程可實現(xiàn)近緣物種間的準確基因配對,并結合轉錄組數據完成跨物種時序性轉錄組分析,高效地篩選鑒定候選關鍵差異表達基因。其中,設計了EVI這一基因差異表達指標,可同時體現(xiàn)物種間對應基因的表達水平差異、表達量倍數差異以及表達模式變化差異?;驅Φ腅VI值越高,兩個同源基因的差異表達就越顯著。經測試,EVI可以作為鑒定控制特定性狀或發(fā)育過程(如花色素苷合成、辣椒素合成、內果皮木質化和大腦體積增大)的候選關鍵基因的有效指標。

論文共同通訊作者夏瑞表示,SynGAP基于近緣物種基因共線性,去鑒定并矯正原始基因結構注釋中的潛在錯漏,實現(xiàn)了基因結構注釋的優(yōu)化;并為更精準的比較基因組和比較轉錄數據分析提供了新策略。

相關論文信息:https://doi.org/10.1186/s13059-024-03359-8

來源:中國科學報