為了實現(xiàn)精準醫(yī)療,許多國家已經(jīng)開展本地人群的全基因組測序(WGS)研究。不過,目前的WGS資源主要來自歐洲人,而亞洲基因組在公共數(shù)據(jù)庫中的代表性不足。

為此,新加坡科技研究局(A*STAR)領(lǐng)導的團隊對新加坡的中國人、馬來人和印度人三個群體開展了大規(guī)模測序,并在《Cell》雜志上發(fā)表了題為“Large-Scale Whole-Genome Sequencing of Three Diverse Asian Populations in Singapore”的文章。

“新加坡三個主要種族提供了東南亞地區(qū)遺傳多樣性的獨特快照,”作者在文中寫道。這篇文章的通訊作者包括華中科技大學的王超龍教授和新加坡國立大學的劉建軍教授,他們同時隸屬于新加坡科技研究局。

Cell:新加坡三個亞洲人群的大規(guī)模測序-肽度TIMEDOO

SG10K聯(lián)盟的成員對新加坡的4,810名中國人、馬來人和印度人進行了測序,發(fā)現(xiàn)了9,830萬個新穎的或已知的多態(tài)性,可用來評估亞洲血統(tǒng)在這些族裔中的比例。他們還追蹤了至少20個表現(xiàn)出自然選擇跡象的基因座,其中14個與復雜性狀和疾病相關(guān)聯(lián)。

基于這些研究,作者認為“對新加坡人的全基因組測序有望讓整個亞洲以及世界其他地區(qū)的人群受益”。他們預計,“SG10K的數(shù)據(jù)將成為寶貴的資源,可推動亞洲人的遺傳性狀和復雜疾病研究,并緩解目前人類遺傳學研究中的群體差異”。

這項研究屬于新加坡萬人基因組測序計劃的早期階段。在此,研究人員對4,800多人進行測序,平均測度深度達13.7倍。參與者包括2,780名中國人、903名馬來人和1,127名印度人,來自8個不同的隊列。

在剔除了不符合質(zhì)量控制標準的變異后,他們獲得了8,910萬個SNP和910萬個小的插入缺失(indel)。其中,大約4,560萬個SNP和630萬個indel未曾出現(xiàn)在以往的群體研究中。

研究人員將1,200多名個體以往的基因型數(shù)據(jù)與此次分析的結(jié)果進行比較,確認了這些變異的質(zhì)量,然后才深入研究芯片未覆蓋的罕見變異。通過這種方式,他們記錄了2,525名健康個體的變異數(shù)量和類型,包括與隱性疾病風險相關(guān)的變異。

通過主成分分析(PCA),研究人員發(fā)現(xiàn)新加坡中國人和新加坡印度人分別與東亞人和南亞人重疊,而新加坡馬來人與其他群體相對較遠,這意味著馬來人代表了東南亞的土著人。同時,他們還追溯了新加坡各個人群的起源。

考慮到SG10K的數(shù)據(jù)將成為亞洲人群數(shù)據(jù)的寶貴資源,研究人員接著評估了數(shù)據(jù)集的有效性?!凹词共捎脟栏竦臉藴?,我們也能夠檢測到亞洲人群以往報道的許多基因座,”他們寫道。這些結(jié)果凸顯了SG10K數(shù)據(jù)將成為推動亞洲人群遺傳學研究的寶貴資源。

來源:生物通

原文檢索

Large-Scale Whole-Genome Sequencing of Three Diverse Asian Populations in Singapore

Cell? VOLUME 179, ISSUE 3, P736-749.E15, OCTOBER 17, 2019