北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心湯富酬課題組開發(fā)出基于單分子測序平臺的scNanoHi-C技術(shù),可精準(zhǔn)檢測單細胞高階染色質(zhì)互作
真核生物基因的表達受到基因組中順式作用元件的復(fù)雜調(diào)控。哺乳動物基因組中存在大量的順式作用元件,例如:啟動子、增強子、沉默子、絕緣子等等,其數(shù)量遠遠超過蛋白編碼基因。目前人類基因組中已知的順式調(diào)控元件就有一百多萬個,而蛋白編碼基因只有大約兩萬個。遺傳學(xué)研究也表明基因調(diào)控不僅僅是單個基因之間一對一的簡單調(diào)控事件,而是以調(diào)控網(wǎng)絡(luò)的形式發(fā)揮作用,不同的調(diào)控元件以及靶基因之間存在著復(fù)雜的相互作用。例如,一個基因的啟動子可以整合來自多個增強子或者沉默子的調(diào)控作用,一個增強子元件也能夠同時影響多個基因的表達1-3。隨著三維基因組技術(shù)的發(fā)展,人們對基因表達調(diào)控相關(guān)的染色質(zhì)構(gòu)象已經(jīng)有了一定的理解,但由于技術(shù)的限制,大部分研究都是集中在成對的相互作用(pair-wiseinteraction)上,而對于多個順式調(diào)控元件同時與一個基因啟動子之間的高階相互作用(high-orderinteraction)的研究仍然比較有限。此外,多個基因組元件是如何通過三維基因組構(gòu)象的變化同時參與基因表達調(diào)控的機制目前也尚不清楚。
近年來,為了探究更精準(zhǔn)和全面的染色質(zhì)互作情況,檢測高階染色質(zhì)互作的技術(shù)也相繼出現(xiàn)。然而,這些技術(shù)往往局限于基因組的特定位點,或是需要特殊的儀器設(shè)備。得益于三代測序平臺(單分子測序平臺)的日漸成熟,最近開發(fā)的基于牛津納米孔技術(shù)(Oxford Nanopore Technology, ONT)的Pore-C方法4在檢測染色質(zhì)高階相互作用方面表現(xiàn)出優(yōu)異的性能,可以通過應(yīng)用新的統(tǒng)計方法有效地分析全基因組中多個染色質(zhì)位點之間高階相互作用的協(xié)同性。
盡管上述這些基于大量細胞的研究方法能夠有效地檢測染色質(zhì)的高階相互作用,但它們無法解決細胞間的異質(zhì)性問題,阻礙了它們在復(fù)雜組織器官樣品中的應(yīng)用。而現(xiàn)有的單細胞Hi-C(single-cell Hi-C,scHiC)技術(shù)受限于二代測序較短的讀長(通常是雙端總共300bp)也難以對染色質(zhì)高階相互作用進行檢測。目前除了單細胞超分辨率成像以外,2022年開發(fā)的scSPRITE5是唯一一種可以在單細胞水平檢測染色質(zhì)高階相互作用的測序方法。但是該方法更適用于遠距離的間接染色質(zhì)高階相互作用,而對于與基因調(diào)控更相關(guān)的直接染色質(zhì)高階相互作用的檢測能力很有限。此外,scHi-C的另一個挑戰(zhàn)是很難平衡捕獲細胞群體異質(zhì)性所需的高通量(每次實驗?zāi)軌驒z測大量單細胞)與探索高分辨率3D基因組結(jié)構(gòu)所需的高深度(每個單細胞中捕獲大量染色質(zhì)相互作用)之間的矛盾。因此,需要一種可擴展的scHi-C方法來剖析高階染色質(zhì)三維結(jié)構(gòu),并在單細胞水平上研究這些染色質(zhì)高階相互作用在不同生物過程中的協(xié)同調(diào)控機制。
為了應(yīng)對這些挑戰(zhàn),2023年8月28日,北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心湯富酬課題組在Nature Methods上發(fā)表題為“scNanoHi-C: a single-cell long-read concatemer sequencing method toreveal high-order chromatin structures within individual cells”的文章。該研究在國際上率先使用單分子測序平臺開發(fā)了一種基于鄰近連接的單細胞染色質(zhì)構(gòu)象捕獲方法,稱為scNanoHi-C。該方法實現(xiàn)了在單細胞水平的高階染色質(zhì)相互作用檢測,并且在通量上具有很好的靈活性,能夠滿足不同的實驗需求。
在實驗上,scNanoHi-C依次使用1%甲醛(FA)和1.5mM戊二酸二琥珀酰亞胺酯(DSG)孵育進行交聯(lián),以降低連接反應(yīng)的隨機噪音并兼顧對短程和長程染色質(zhì)相互作用的高靈敏度檢測。為了盡可能完整地保留單細胞中固定連接后的染色質(zhì)三維結(jié)構(gòu)信息,該研究設(shè)計了一種靈活的單細胞基因組長片段擴增方法。該方法使用兩端具有相同接頭的低濃度Tn5轉(zhuǎn)座酶以提高DNA片段擴增長度和基因組覆蓋度,并通過設(shè)計24種帶有不同條碼標(biāo)簽的Tn5酶結(jié)合后續(xù)PCR擴增中引入的條碼標(biāo)簽共同控制測序的通量。通過這種方式,scNanoHi-C 能夠在一次PromethION測序中對少至幾個單細胞進行低通量、高覆蓋度測序或者對數(shù)千個單細胞(最高可達24×96=2304個細胞)進行高通量、低覆蓋度測序,可以根據(jù)實驗需求靈活進行選擇(圖1)。
為了評估scNanoHi-C技術(shù)的可靠性,該研究首先將scNanoHi-C應(yīng)用于正常二倍體的GM12878細胞系,并分別使用低深度(~0.2Gb/cell)、中等深度(~1Gb/cell)、高深度(~4Gb/cell)三種策略進行測序,并與基于二代測序平臺的大量細胞原位Hi-C標(biāo)準(zhǔn)數(shù)據(jù)集進行比較,結(jié)果顯示出很高的一致性。同時每個策略檢測到的串聯(lián)體(含有有效染色質(zhì)相互作用的測序讀段)中大約一半為高階串聯(lián)體(包含三個以上不同調(diào)控元件間的相互作用)。在這些高階串聯(lián)體中,大約58%是三聯(lián)體,26%是四聯(lián)體,其余為五聯(lián)體以上的多聯(lián)體(基數(shù)從5到11不等)。
接著該研究在多個方面對scNanoHi-C的應(yīng)用進行了探索:
scNanoHi-C可以在單細胞水平上精準(zhǔn)捕獲染色質(zhì)三維結(jié)構(gòu)的異質(zhì)性。
scNanoHi-C能夠在單細胞水平檢測各層級染色質(zhì)結(jié)構(gòu)特征,包括染色體領(lǐng)域(整條染色體,50Mb-200Mb尺度的結(jié)構(gòu)特征)、A/B區(qū)室(常染色質(zhì)區(qū)域與異染色質(zhì)區(qū)域,5Mb-20Mb尺度的結(jié)構(gòu)特征),以及拓撲關(guān)聯(lián)結(jié)構(gòu)域樣結(jié)構(gòu)(TAD-like,0.5Mb-5Mb尺度的結(jié)構(gòu)特征)。同時,scNanoHi-C的單個染色質(zhì)片段長度(單體長度,平均610bp)相較于傳統(tǒng)基于二代測序平臺的scHi-C(測序不超過150bp)顯著提高,這大大增加了其在染色質(zhì)相互作用對中捕獲到單核苷酸多態(tài)性(SNP)位點的機會,能夠在二倍體細胞中直接判定單倍型的單體比例由原來二代測序平臺的大約9%提高到了25%。因此,scNanoHi-C也可用于有效地重建單個二倍體細胞的基因組三維構(gòu)象。同時,利用單細胞A/B 區(qū)室化值(single-cell A/B compartment value, scA/B value),scNanoHi-C對GM12878、HG002 和K562三種人類細胞系進行了聚類分析,能夠在單細胞精度準(zhǔn)確將三種細胞分開,并識別了細胞類型間的染色質(zhì)差異區(qū)室化區(qū)域。此外,scNanoHi-C也能夠準(zhǔn)確地檢測每個單細胞的基因組拷貝數(shù)變異(CNV)特征。分析結(jié)果表明,scNanoHi-C準(zhǔn)確地捕獲了GM12878細胞培養(yǎng)過程中產(chǎn)生的非整倍體亞克隆以及K562細胞的拷貝數(shù)變異。同時,scNanoHi-C也可應(yīng)用于結(jié)構(gòu)變異的檢測,如準(zhǔn)確檢測出了K562細胞中BCR-ABL1和NUP214-XKR3的基因融合事件(染色體易位事件)。
scNanoHi-C能夠在單個細胞中準(zhǔn)確鑒定高階染色質(zhì)相互作用。
該研究在GM12878 細胞數(shù)據(jù)集中,使用scNanoHi-C得到的單細胞高階串聯(lián)體信息結(jié)合ABC模型(Activity-by-contacts model)6預(yù)測的增強子-啟動子(E-P) 相互作用關(guān)系共同鑒定了增強子-啟動子高階相互作用。通過這種方式,該研究首次在單個細胞中以20kb的分辨率直接觀察到1097個基因的單個啟動子能夠與多個增強子同時發(fā)生相互作用,表明這些基因可能同時受到多個增強子的調(diào)控。這些受到高階調(diào)控的基因主要富集在與GM12878這種B淋巴細胞的功能相關(guān)的免疫信號通路上,并且通常表現(xiàn)出更高的表達水平。特別地,這些基因中還包括一些B細胞譜系特異性轉(zhuǎn)錄因子如EBF1以及EBV超級增強子相關(guān)基因如MIR155HG、IKZF3和ETS1等。這些結(jié)果表明,多個增強子的協(xié)同調(diào)控可能是確保關(guān)鍵基因高水平穩(wěn)健表達的一種潛在機制。通過類似的方法,該研究還在單個細胞中鑒定出了1422個能夠與多個啟動子同時發(fā)生相互作用的增強子。此外,該研究發(fā)現(xiàn)部分高階基因調(diào)控作用能夠在多個單細胞中被檢測到,這可能與細胞中頻繁使用的關(guān)鍵轉(zhuǎn)錄程序有關(guān),后續(xù)可以通過發(fā)展基于富集策略的具有更高分辨率的Hi-C技術(shù)進行進一步的深入研究。
scNanoHi-C能夠揭示不同基因組區(qū)域之間的協(xié)同調(diào)控關(guān)系以及染色體外環(huán)形DNA與線性基因組間的復(fù)雜相互作用。
傾向于形成高階相互作用的一組基因組位點稱為“基因組協(xié)同調(diào)控區(qū)域”。該研究針對scNanoHi-C的數(shù)據(jù)特點對鑒定基因組協(xié)同調(diào)控區(qū)域的算法進行了優(yōu)化,并將該算法運用到GM12878細胞活躍啟動子和增強子的集合中,在全基因組范圍內(nèi)共鑒定出了917組增強子-啟動子協(xié)同調(diào)控區(qū)域。其中,大約20%(187/917)的協(xié)同調(diào)控區(qū)域包含來自不同染色體的基因組位點(提示不同染色體之間的反式相互作用)。這些協(xié)同調(diào)控區(qū)域在活躍轉(zhuǎn)錄的基因組區(qū)域、淋巴細胞特異性轉(zhuǎn)錄因子和染色質(zhì)環(huán)相關(guān)因子(CTCF等)的結(jié)合位點區(qū)域中高度富集。此外,在917個協(xié)同調(diào)控區(qū)域中,有167個被發(fā)現(xiàn)與GM12878細胞特異性的超級增強子有關(guān)。接著,該研究將scNanoHi-C運用到攜帶大量染色體外環(huán)形DNA(ecDNA)的COLO320DM人類結(jié)直腸癌細胞系中,檢測到了染色體外環(huán)形DNA與線性基因組(染色體內(nèi)的基因組)之間存在廣泛的染色質(zhì)高階相互作用,并且首次在單個細胞中觀察到四個主要的染色體外環(huán)形DNA的基因位點之間存在復(fù)雜的高階相互作用。這些結(jié)果表明,染色體外環(huán)形DNA可能通過建立復(fù)雜的高階染色質(zhì)三維結(jié)構(gòu)來驅(qū)動癌基因的過量表達。
scNanoHi-C能夠高效輔助單細胞基因組從頭組裝。
在可用細胞數(shù)量有限的情況下,該研究表明使用scNanoHi-C輔助單細胞基因組(single-cell whole genome sequencing,scWGS)從頭組裝7可以大幅度提高組裝質(zhì)量。例如,使用20個單細胞的基因組長讀長測序數(shù)據(jù)和12個單細胞的scNanoHi-C數(shù)據(jù)組裝的人類基因組支架(scaffold)的NG50要優(yōu)于使用30個單細胞的基因組長讀長測序數(shù)據(jù)直接組裝的效果(2.49 Mb vs. 1.34 Mb)
總之,scNanoHi-C具有很好的可擴展性和靈活性,在一次測序中可對少至幾個單細胞或多達數(shù)千個單細胞進行染色質(zhì)三維結(jié)構(gòu)測序,并且實驗流程相對簡單、易于操作,僅需要基本的PCR儀等分子生物學(xué)設(shè)備,適合于各種生物學(xué)實驗室使用。scNanoHi-C還是一種強大且多功能的工具,可用于在單細胞分辨率準(zhǔn)確區(qū)分細胞類型、對單個二倍體細胞進行高效單倍型分型、檢測單個正常細胞和腫瘤細胞中的基因組拷貝數(shù)變異和各種復(fù)雜結(jié)構(gòu)變異以及高效輔助單細胞基因組從頭組裝。更重要的是,scNanoHi-C首次實現(xiàn)了在單個細胞中在全基因組水平對增強子-啟動子的高階直接相互作用的檢測,在單個細胞中準(zhǔn)確鑒定了高階基因調(diào)控事件,同時能夠?qū)?fù)雜的染色體外環(huán)形DNA與線性基因組間的高階相互作用進行精準(zhǔn)檢測??傊?,scNanoHi-C顯示了單細胞長讀長Hi-C測序技術(shù)在分析由高階染色質(zhì)三維結(jié)構(gòu)介導(dǎo)的不同細胞間基因調(diào)控異質(zhì)性方面的潛力,為將來進一步研究發(fā)育和疾病進展過程中高階染色質(zhì)結(jié)構(gòu)變化機制,揭開基因組中各種復(fù)雜調(diào)控關(guān)系中的“暗物質(zhì)”奠定了堅實的基礎(chǔ)。
北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心、前沿交叉學(xué)科研究院生命科學(xué)聯(lián)合中心博士生李文、生命科學(xué)學(xué)院博士生盧健森為該論文的共同第一作者,湯富酬為該論文通訊作者。該研究得到了國家自然科學(xué)基金基礎(chǔ)科學(xué)中心項目、北京未來基因診斷高精尖創(chuàng)新中心、昌平實驗室的資助,北京大學(xué)高通量測序平臺以及北京大學(xué)“北極星”高性能計算平臺的協(xié)助與支持,北京大學(xué)邢棟課題組為本研究提供了重要的幫助。
參考文獻:
1、Hafner, A. & Boettiger, A. The spatial organization of transcriptional control. Nat Rev Genet, doi:10.1038/s41576-022-00526-0 (2022).
2、Oudelaar, A. M. & Higgs, D. R. The relationship between genome structure and function. Nat Rev Genet22, 154-168, doi:10.1038/s41576-020-00303-x (2021).
3、Furlong, E. E. M. & Levine, M. Developmental enhancers and chromosome topology. Science361, 1341-1345, doi:10.1126/science.aau0320 (2018).
4、Deshpande, A. S. et al. Identifying synergistic high-order 3D chromatin conformations from genome-scale nanopore concatemer sequencing. Nat Biotechnol40, 1488-1499, doi:10.1038/s41587-022-01289-z (2022).
5、Arrastia, M. V. et al. Single-cell measurement of higher-order 3D genome organization with scSPRITE. Nature Biotechnology40, 64-73, doi:10.1038/s41587-021-00998-1 (2021).
6、Fulco, C. P. et al. Activity-by-contact model of enhancer-promoter regulation from thousands of CRISPR perturbations. Nat Genet51, 1664-1669, doi:10.1038/s41588-019-0538-0 (2019).
7Xie, H. et al. De novo assembly of human genome at single-cell levels. Nucleic Acids Res50, 7479-7492, doi:10.1093/nar/gkac586 (2022).
來源:北京大學(xué)


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。