北大陸劍團(tuán)隊(duì)聯(lián)合呂雪梅、張亞平課題組發(fā)表新型冠狀病毒基因組的演化分析及譜系劃分
2021年2月6日,北京大學(xué)生命科學(xué)學(xué)院陸劍課題組與中國(guó)科學(xué)院昆明動(dòng)物所呂雪梅、張亞平課題組,中國(guó)疾病預(yù)防控制中心譚文杰課題組合作在《科學(xué)通報(bào)》上發(fā)表了題為“Evolutionary analysis and lineage designation of SARS-CoV-2 genomes”的論文,解析了新型冠狀病毒(以下簡(jiǎn)稱(chēng)新冠病毒)基因組的演化規(guī)律,提出了具有層次結(jié)構(gòu)的譜系/亞譜系劃分系統(tǒng)。
病毒的演化極其迅速,隨著感染人數(shù)爆發(fā)性增加,新冠病毒會(huì)快速發(fā)展出許多不同的株系。探明病毒的譜系發(fā)生歷史,對(duì)不同的毒株進(jìn)行分型,結(jié)合流行病學(xué)及臨床數(shù)據(jù)揭示新冠病毒的變異規(guī)律,對(duì)疫情的防控尤為重要。在研究團(tuán)隊(duì)前期的工作中,已根據(jù)兩個(gè)高度連鎖的位點(diǎn)將新冠病毒劃分為L(zhǎng)和S兩個(gè)主要譜系,并描述了這兩個(gè)譜系在傳播過(guò)程中不同的行為模式。國(guó)際上也已發(fā)表諸多研究為新冠病毒進(jìn)行分型。然而,隨著新冠病毒基因組序列的迅速積累,人們又檢測(cè)到并發(fā)表了成千上萬(wàn)的基因組變異,出現(xiàn)了許多值得進(jìn)一步標(biāo)記的亞型,大量相似的病毒序列對(duì)SARS-CoV-2基因組系統(tǒng)發(fā)育的可靠推斷提出了重大挑戰(zhàn),亟需研究對(duì)這些新出現(xiàn)的變異進(jìn)行梳理與描述,更加精細(xì)化地展示新冠病毒在人群中的演變軌跡。
為解決這一問(wèn)題,研究團(tuán)隊(duì)分析了121,618個(gè)高質(zhì)量的病毒基因組中的單核苷酸變異(SNV),在L和S分型的基礎(chǔ)上,根據(jù)3個(gè)主導(dǎo)性SNV將L譜系劃分為L(zhǎng)1和L2兩個(gè)主要亞譜系,再根據(jù)位點(diǎn)的突變頻率和連鎖性篩選出201個(gè)代表性SNV,進(jìn)一步逐級(jí)劃分出130個(gè)亞譜系(S中37個(gè),L1中35個(gè),L2中58個(gè)),繪制成了完整的反映各個(gè)譜系之間親緣關(guān)系的單倍型網(wǎng)絡(luò)圖(圖1)。作者同時(shí)建立了實(shí)時(shí)更新的配套網(wǎng)站(www.covid19evolution.net)方便查看亞譜系信息,此外用戶(hù)還可自由上傳新冠病毒基因組序列進(jìn)行譜系鑒定。
圖1. 基于206個(gè)分型標(biāo)記位點(diǎn)的130個(gè)亞譜系的單倍型網(wǎng)絡(luò)
為闡明不同亞譜系的病毒的流行程度是否有所不同,作者依據(jù)上述譜系劃分系統(tǒng)對(duì)有具體采樣時(shí)間信息的119,168個(gè)高質(zhì)量病毒基因組進(jìn)行劃分,并挖掘了這些譜系的時(shí)空分布演變規(guī)律。研究發(fā)現(xiàn),各個(gè)譜系在不同地域上的傳播表現(xiàn)十分不同。例如,在歐洲(n=71,120),大多數(shù)病毒屬于L譜系(70,434,99.0%),其中L2d(26,206,36.8%)和L2b(19,416,27.3%)是兩個(gè)最大的亞譜系,而在亞洲(n=8066),S譜系占到了7.1%(576),L譜系最初以L(fǎng)2d(2381,29.5%)為主,但隨后L2g的頻率顯著增加。其余大洲各個(gè)譜系出現(xiàn)的頻率也不盡相同。(圖2)這表明,在地理?xiàng)l件、交通運(yùn)輸、文化風(fēng)俗、防疫政策、超級(jí)傳播者等各種因素共同作用下,病毒譜系在不同地域之間有各自獨(dú)特的分布模式,這就為病例的分子溯源提供了理論依據(jù)。
圖2. 譜系/亞譜系的時(shí)空分布
例如,研究團(tuán)隊(duì)收集了國(guó)內(nèi)從2020年4月到2021年1月的輸入病例數(shù)據(jù),將它們?cè)谧V系劃分系統(tǒng)單倍型網(wǎng)絡(luò)上進(jìn)行展示(圖3),可以為輸入型病例的來(lái)源提供推斷信息。
圖3. 輸入型病例亞譜系的單倍型網(wǎng)絡(luò)分析
此外,各個(gè)譜系頻率的時(shí)空變化軌跡還能為理解新冠病毒的演化規(guī)律提供線(xiàn)索。第一,雖然取樣偏差、奠基者效應(yīng)可能會(huì)造成譜系頻率的波動(dòng),但那些顯著快速在人群中流行的病毒譜系可能是由于其獲得了有利突變,據(jù)此可以追蹤這些突變對(duì)新冠病毒臨床特性造成的改變,幫助理解其致病機(jī)理以及開(kāi)發(fā)潛在的治療方案。第二,研究者發(fā)現(xiàn)病毒基因組上的許多SNV存在極強(qiáng)的連鎖性,大大偏離了中性進(jìn)化的預(yù)期,這可能說(shuō)明這些SNV之間普遍有上位效應(yīng)存在,亦即,病毒出現(xiàn)一個(gè)有害突變后,可能會(huì)很快產(chǎn)生另一個(gè)“代償性”突變將上一個(gè)突變的害處抵消掉。這可能反映了新冠病毒具有“多分枝化”的進(jìn)化特征,造就了各個(gè)譜系之間相當(dāng)復(fù)雜的系統(tǒng)發(fā)生關(guān)系。
總之,該研究囊括了目前出現(xiàn)的絕大多數(shù)新冠基因組變異并整理了它們的譜系關(guān)系,闡明其中各個(gè)譜系時(shí)空分布的規(guī)律,搭建出新冠病毒演化的大體框架,對(duì)理解病原體變異規(guī)律、新冠流行病學(xué)追蹤、預(yù)測(cè)病毒的演化方向有重要意義。
該課題還得到了北京市疾控中心、醫(yī)科院病原所、北京基因組研究所、上海營(yíng)養(yǎng)健康所、中科院植物生理生態(tài)研究所、武漢大學(xué),以及中科院微生物所等單位的參與。研究工作獲得國(guó)家自然科學(xué)基金、科技部以及中科院“西部之光”項(xiàng)目的支持。
來(lái)源:北京大學(xué)新聞網(wǎng)

