乳腺癌(breast cancer)是一類因乳腺上皮細(xì)胞增殖失控而導(dǎo)致的惡性腫瘤,其發(fā)病率常年位居女性惡性腫瘤首位,因此它也被稱為“粉紅殺手”!

在我國,乳腺癌的發(fā)病率呈逐年上升趨勢,每年有30余萬女性被診斷出乳腺癌,在東部沿海地區(qū)及經(jīng)濟(jì)發(fā)達(dá)的大城市,乳腺癌發(fā)病率上升尤其明顯。

史上最大規(guī)模乳腺癌研究:近500個科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個乳腺癌相關(guān)基因-肽度TIMEDOO

截至目前,乳腺癌因異質(zhì)性等因素,其具體病因尚未完全清楚。所幸,隨著基因組大數(shù)據(jù)分析的發(fā)展,人類對乳腺癌等惡性腫瘤相關(guān)基因突變的認(rèn)知愈漸增多。全基因組關(guān)聯(lián)研究(GWAS)已在150多個基因組區(qū)域發(fā)現(xiàn)與乳腺癌風(fēng)險相關(guān)的基因變異。然而,這150多個基因區(qū)域里僅有不到20個區(qū)域被詳細(xì)研究,驅(qū)動這些關(guān)聯(lián)的大多數(shù)變異和基因仍然是未知的。

近日,《Nature Genetics》刊發(fā)了一篇有關(guān)乳腺癌靶基因精準(zhǔn)定位的研究論文。該研究規(guī)??涨?,由劍橋大學(xué)、哈佛大學(xué)領(lǐng)銜,458家科研單位的近500位科研人工共同完成。

研究人員利用密集基因型數(shù)據(jù)對所有已知的乳腺癌風(fēng)險區(qū)域進(jìn)行精細(xì)繪制,數(shù)據(jù)涉及超過217000名參與者——基因型數(shù)據(jù)來自乳腺癌協(xié)會聯(lián)合會(BCAC)和BRCA1/2修飾子研究者聯(lián)盟(CIMBA)。通過人群大數(shù)據(jù)分析以及基因芯片分析,在150個乳腺癌高風(fēng)險區(qū)域精準(zhǔn)定位了191個可能的靶基因。

這些新發(fā)現(xiàn)的乳腺癌基因?qū)椭覀兏敿?xì)地了解乳腺癌是如何產(chǎn)生和發(fā)展的,但目前已知的起作用的基因數(shù)量之多,恰恰突顯了乳腺癌的復(fù)雜性!

所有樣本均使用OncoArray或iCOGS芯片進(jìn)行基因分型,并采用逐步多元邏輯回歸方法識別各區(qū)域的獨立關(guān)聯(lián)信號,并在每個信號中定義可信因果變量(CCVs)。研究者發(fā)現(xiàn)基因組特征與CCVs有明顯重疊,緊接著,他們使用貝葉斯方法,整合基因組特征和遺傳關(guān)聯(lián)從而精簡可能的因果變量集,并計算它們的后驗概率。

最后,研究人員整合了遺傳、表觀遺傳表達(dá)以及染色質(zhì)構(gòu)象數(shù)據(jù),以推斷每個信號的可能靶基因。

史上最大規(guī)模乳腺癌研究:近500個科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個乳腺癌相關(guān)基因-肽度TIMEDOO

研究流程圖

1、確定每個風(fēng)險區(qū)域的可信因果變量(CCVs)

研究者對GWASs發(fā)現(xiàn)的150個乳腺癌風(fēng)險區(qū)域進(jìn)行了多次互補(bǔ)分析,發(fā)現(xiàn)了362個獨立的風(fēng)險信號,其中205個具有較高的可信度。他們觀察到,大多數(shù)風(fēng)險區(qū)域包含多個獨立信號,ESR1(雌激素受體)及其共調(diào)控基因周圍區(qū)域的數(shù)量最多(9個)。

史上最大規(guī)模乳腺癌研究:近500個科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個乳腺癌相關(guān)基因-肽度TIMEDOO

研究者使用了兩種互補(bǔ)的方法來確定每個乳腺癌風(fēng)險區(qū)域內(nèi)的CCVs:PAINTOR(一種貝斯葉方法)和傳統(tǒng)的多項式回歸方法。CCVs支持由多項式回歸發(fā)現(xiàn)的大多數(shù)關(guān)聯(lián),并且還確定了額外的變體。具體來說,貝葉斯方法強(qiáng)調(diào)了15個很可能是因果關(guān)系的變量(HPP≥80%)。從這些方法中,我們在每34個信號中分別識別出一個可能是因果關(guān)系的單一變量。

史上最大規(guī)模乳腺癌研究:近500個科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個乳腺癌相關(guān)基因-肽度TIMEDOO

在其他信號中,我們也發(fā)現(xiàn)了四個之前被認(rèn)為有害的編碼變化:無義突變rs11571833(BRCA2);兩個CHEK2編碼變體(移碼突變);和剪接變異體(TERT中的rs10069690,導(dǎo)致端粒酶活性降低、端??s短和DNA損傷反應(yīng)增加等)。

2、揭示CCVs在DNA水平上的功能,并預(yù)測它們的目標(biāo)基因

值得注意的是,在150個乳腺癌風(fēng)險區(qū)域中,許多與ER陽性(乳腺癌ER陽性率在50%~80%左右)乳腺癌風(fēng)險相關(guān)的CCVs存在于標(biāo)記為開放和活躍的ER陽性乳腺細(xì)胞的基因調(diào)控區(qū)域,而不存在于其他類型的細(xì)胞中。此外,相當(dāng)一部分潛在的CCVs與轉(zhuǎn)錄因子蛋白的結(jié)合位點以及協(xié)同調(diào)節(jié)因子相互重疊。

史上最大規(guī)模乳腺癌研究:近500個科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個乳腺癌相關(guān)基因-肽度TIMEDOO

9種蛋白(CREBBP、EP300、ESR1、FOXI1、GATA3、MEF2B、MYC、NRIP1和TCF7L2)也出現(xiàn)在高可信度靶基因列表中。這些基因編碼的大多數(shù)蛋白質(zhì)在雌激素信號傳導(dǎo)通路中發(fā)揮作用。CREBBP、EP300、ESR1、GATA3和MYC也是已知的在乳腺腫瘤中經(jīng)常發(fā)生體細(xì)胞突變的癌癥驅(qū)動基因。

史上最大規(guī)模乳腺癌研究:近500個科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個乳腺癌相關(guān)基因-肽度TIMEDOO

3、與ER陽性信號相比,ER陰性信號豐富的基因組特征更少

研究者們發(fā)現(xiàn)相較于ER陽性信號,ER陰性信號乳腺癌關(guān)聯(lián)基因更少。BCAC和CIMBA機(jī)構(gòu)的ER陰性腫瘤患者中,不到20%的基因組信號意味著更大的er陰性乳腺癌風(fēng)險。除此之外,ER陰性乳腺癌細(xì)胞系的ChIP-Seq公開數(shù)據(jù)很少和ER陰性腫瘤的異質(zhì)性等因素也限制了這方面研究的展開。

盡管如此,本研究還是找尋到35個ER陰性乳腺癌可能的靶基因。其中一些已經(jīng)有功能證據(jù)支持:CASP8和MDM4。然而,目前大多數(shù)靶點在ER陰性乳腺癌的發(fā)生發(fā)展中沒有報道。

4、研究靶基因最常存在的基因本體通路

免疫、炎癥和腫瘤發(fā)生之間的聯(lián)系已被廣泛研究,而值得注意的是,14%(25/180)的高可信度靶基因和19%的ER陰性靶基因被預(yù)測定位于免疫系統(tǒng)途徑中,如T細(xì)胞活化、Toll樣受體級聯(lián)復(fù)合物以及I-κB/ NF-κB等信號通路。5個ER陰性高置信度靶基因(ALK, CASP8, CFLAR, ESR1 和 TNFSF10)位于I-κB/ NF-κB信號通路中,有趣的是,與ER陽性細(xì)胞相比,ER陰性細(xì)胞具有更高水平的NF-kB活性。此外,最近對乳腺癌腫瘤組織的表達(dá)甲基化分析也發(fā)現(xiàn)了兩個與DNA甲基化水平相關(guān)的基因簇:一個富集于ER信號基因,另一個富集于免疫通路基因。

史上最大規(guī)模乳腺癌研究:近500個科研機(jī)構(gòu)合作研究了21萬人,發(fā)現(xiàn)191個乳腺癌相關(guān)基因-肽度TIMEDOO

本研究的領(lǐng)導(dǎo)者,劍橋大學(xué)Alison Dunning博士認(rèn)為,這些令人難以置信的新發(fā)現(xiàn)的乳腺癌基因為我們提供了更多的基因進(jìn)行研究,這將幫助我們更詳細(xì)地了解乳腺癌是如何產(chǎn)生和發(fā)展的,但目前已知的起作用的基因數(shù)量之多,恰恰突顯了乳腺癌的復(fù)雜性!

總的來說,本論文的研究分析為200多個獨立的乳腺癌風(fēng)險信號提供了強(qiáng)有力的證據(jù),確定了許多高可信度的乳腺癌靶基因。雖然每一種基因變異只會使患乳腺癌的風(fēng)險增加非常小的一部分,但綜合起來,這些基因變異將讓女性更清楚地了解自己的患病風(fēng)險,這也將使醫(yī)生和臨床醫(yī)生能夠就降低乳腺癌風(fēng)險提供最佳策略。

參考資料:

[1] Fine-mapping of 150 breast cancer risk regions identifies 191 likely target genes

來源:BioWorld