資訊
頻道
當(dāng)前位置:首頁(yè) > 醫(yī)療器械資訊 > 技術(shù)前沿 > IF38!DNA甲基化相關(guān)癌癥的診斷與預(yù)后分析~

IF38!DNA甲基化相關(guān)癌癥的診斷與預(yù)后分析~

文章來(lái)源:健康界發(fā)布日期:2022-12-06瀏覽次數(shù):116

01 ESCC中差異甲基化CpG位點(diǎn)概述

在通過(guò)質(zhì)量控制的 429,717 個(gè)探針中(92%),35,577 個(gè)(8.28%)在腫瘤和鄰近的正常樣本之間存在差異甲基化(DMC )(FDR q < 0.05,中位甲基化差異 |MMD | > 0.20 ),其中 56.54% (20,114/35,577) DMC 是低甲基化的。DMC 的分布在染色體之間不同,主要富集于 8 號(hào)染色體,在 22 號(hào)染色體中大部分不存在。高甲基化位點(diǎn)主要富集在 18 號(hào)和 19 號(hào)染色體中,而低甲基化位點(diǎn)主要富集于 8 號(hào)染色體中。

此外,DMCs 在基因間和增強(qiáng)子區(qū)域富集,在基因間區(qū)域具有比超甲基化 CpG 位點(diǎn)更多的低甲基化位點(diǎn),在增強(qiáng)子區(qū)域同樣具有豐富的超甲基化和低甲基化位點(diǎn)。超甲基化 CpG 位點(diǎn)也富集在 CpG 島和 DNase I 超敏位點(diǎn),而低甲基化位點(diǎn)也富集在開(kāi)放海區(qū)域,在啟動(dòng)子區(qū)域內(nèi)的超甲基化位點(diǎn)多于低甲基化位點(diǎn)。在染色體水平上,8號(hào)染色體富含低甲基化位點(diǎn),主要存在于公海、基因間和增強(qiáng)子區(qū)域;18 號(hào)和 19 號(hào)染色體富含高甲基化位點(diǎn),主要分布在 CpG 島、啟動(dòng)子和 DNase I 超敏反應(yīng)位點(diǎn)中。 本研究的 ESCC 樣本的基因組在啟動(dòng)子和鄰近區(qū)域包含了超出預(yù)期的高甲基化,而低甲基化在整個(gè)基因組中占主導(dǎo)地位。73241 (9.11%) 啟動(dòng)子或基因體 DMCs 與其宿主基因在 ESCC 中的表達(dá)水平相關(guān)。這些 DMCs大多在 7 號(hào)染色體中并且更有可能駐留在基因體中而不是啟動(dòng)子和鄰近區(qū)域。

因?yàn)閱?dòng)子和基因體上的 DMCs通常以不同方式影響宿主基因表達(dá),本研究使用在之前研究中獲得的相同患者的基因表達(dá)譜,研究了啟動(dòng)子-DMC 與負(fù)表達(dá)-甲基化的相關(guān)性和基因體-DMCs與正表達(dá)-甲基化的相關(guān)性。在腫瘤和鄰近正常樣本之間差異表達(dá)的蛋白質(zhì)編碼基因中,90 個(gè)下調(diào)基因和 44 個(gè)上調(diào)基因分別與其啟動(dòng)子區(qū)域的 224 個(gè)高甲基化和 70 個(gè)低甲基化 CpG 位點(diǎn)相關(guān);274 個(gè)下調(diào)基因和 70 個(gè)上調(diào)基因分別與其基因體中的 764 個(gè)低甲基化和 221 個(gè)高甲基化 CpG 位點(diǎn)相關(guān)。

負(fù)相關(guān)啟動(dòng)子-DMCs可能調(diào)控異常的宿主基因在金屬離子結(jié)合、轉(zhuǎn)錄因子活性和轉(zhuǎn)錄調(diào)控的GO類中富集,而正相關(guān)基因體-DMCs可能調(diào)控異常的宿主基因在系統(tǒng)發(fā)育和細(xì)胞部分形態(tài)發(fā)生的GO類中富集。根據(jù)這一結(jié)果,本研究檢測(cè)了這些DMCs相關(guān)基因與已知的人類轉(zhuǎn)錄因子(TF)之間的重疊,發(fā)現(xiàn)TF在高甲基化相關(guān)基因中富集,包括與啟動(dòng)子高甲基化相關(guān)的90個(gè)下調(diào)基因中的32個(gè)和與基因體高甲基化相關(guān)的70個(gè)上調(diào)基因中的39個(gè)。前一組(32個(gè)下調(diào)的轉(zhuǎn)錄因子)大多是鋅指基因家族的成員,如ZNF38228,而后一組(39個(gè)上調(diào)的轉(zhuǎn)錄因子)包括29個(gè)潛在的致癌同源盒子基因,如HOXB13DLX129,這表明全基因組DNA甲基化異??赡軐?dǎo)致參與多種分子過(guò)程的多個(gè)轉(zhuǎn)錄因子的失調(diào),有助于ESCC的發(fā)生和發(fā)展。

02 差異甲基化的CpG位點(diǎn)與ESCC特異性遺傳變異相關(guān)

本研究在之前發(fā)現(xiàn)的 9 個(gè) ESCC 驅(qū)動(dòng)基因 FAT1、NOTCH1JUB、MLL2PIK3CA、TGFBR2NFE2L2、NOTCH3 ZNF75025 中發(fā)現(xiàn)了復(fù)發(fā)性啟動(dòng)子或基因體 DMC(每個(gè)在 >51% (46/91) 患者中)。多達(dá) 97% (88/ 91) 的患者在這些基因中具有啟動(dòng)子或基因體 DMC。

然后本研究將差異甲基化事件的頻率與之前發(fā)現(xiàn)的復(fù)發(fā)ESCC基因組變異相關(guān)聯(lián)。結(jié)果發(fā)現(xiàn)高甲基化事件與基因RB1、NOTCH1CDKN2APIK3CA的體細(xì)胞突變、3q26.32、7p22.314q13.3的擴(kuò)增和2q22.1的缺失相關(guān);低甲基化事件與基因CREBBPNOTCH3的體細(xì)胞突變、19q13.12的擴(kuò)增和3p14.213q14.3的缺失相關(guān)。CismeQTL分析表明,ESCC組織中292個(gè)DMC4864個(gè)鄰近SNPs相關(guān),相鄰正常組織中2064個(gè)DMC29321個(gè)SNPs相關(guān)。與相鄰正常相比,1974個(gè)DMCs在腫瘤基因組中失去了遺傳控制,202個(gè)DMCs獲得了新的相關(guān)性。

03 差異甲基化的CpG位點(diǎn)是ESCC的有效診斷/預(yù)后標(biāo)志物

不僅已鑒定的 DMC ESCC 的各種分子特征相關(guān),它們還可以將 ESCC 與正常食管組織區(qū)分開(kāi)來(lái)。首先本研究假設(shè)相對(duì)少量的 DMC 標(biāo)記物足以用于 ESCC 診斷。為了識(shí)別此類標(biāo)記,本研究將患者隨機(jī)分為訓(xùn)練集 (n = 60) 和驗(yàn)證集 (n = 31),并從1034個(gè)甲基化水平與其宿主基因表達(dá)水平呈負(fù)相關(guān)(或正相關(guān))的啟動(dòng)子/基因體DMC 開(kāi)始。訓(xùn)練集中的腫瘤和相鄰的正常樣本被 1034 個(gè) DMC 充分分離。將隨機(jī)森林和 LASSO 應(yīng)用于這些 DMC 生成了一個(gè)包含 12 個(gè) DMC 的模型。

該模型在訓(xùn)練集中達(dá)到了 98.33% 的靈敏度和 93.33% 的特異性,在驗(yàn)證集中達(dá)到了 96.77% 的靈敏度和 特異性。本研究還計(jì)算了ROC曲線,曲線下面積 (AUC) 在訓(xùn)練集和驗(yàn)證集中分別為 99.6% 97.1%。當(dāng)在其他 ESCC 數(shù)據(jù)集中進(jìn)行測(cè)試時(shí),該診斷模型始終顯示出高靈敏度、特異性和 AUC(圖 4c、f )?;谶@些 DMC 的無(wú)監(jiān)督層次聚類清楚地將 ESCC 與正常組織樣本區(qū)分開(kāi)來(lái)。

接下來(lái)本研究根據(jù) DMC 與樣本和 TCGA ESCC 樣本中 ESCC 患者總生存 (OS) 時(shí)間的相關(guān)性,在 DMC 中尋找潛在的預(yù)后標(biāo)記。對(duì)于每個(gè) DMC,本研究構(gòu)建了一個(gè) Cox 回歸模型,將該 DMC 作為單一預(yù)測(cè)因子,并將年齡、性別、吸煙狀況、飲酒狀況和腫瘤 TNM 分期作為協(xié)變量。結(jié)果四個(gè) DMC與樣本中的患者生存期相關(guān)。然后,本研究通過(guò)對(duì)這 4 個(gè) DMC 的甲基化水平求和構(gòu)建了一個(gè)預(yù)后模型,每個(gè) DMC 均由相應(yīng) Cox 回歸結(jié)果中的風(fēng)險(xiǎn)比 (HR) 加權(quán)。該模型將患者分類為具有高或低預(yù)后風(fēng)險(xiǎn),其中高風(fēng)險(xiǎn)患者的中位 OS 明顯短于其他患者。將該模型應(yīng)用于 TCGA ESCC 樣本產(chǎn)生了類似的結(jié)果:預(yù)測(cè)的高風(fēng)險(xiǎn)患者的中位 OS 短于低風(fēng)險(xiǎn)患者。

接下來(lái)本研究進(jìn)一步對(duì)不同腫瘤階段的患者進(jìn)行了生存分析,以評(píng)估預(yù)后小組的鑒別能力。在早期(I II)患者中,低風(fēng)險(xiǎn)組的 OS 時(shí)間比高風(fēng)險(xiǎn)組長(zhǎng),模型在 TCGA ESCC 隊(duì)列的早期患者中表現(xiàn)不佳。對(duì)于晚期疾病患者(III 期和 IV 期),本研究的模型特別強(qiáng)大。晚期 ESCC 患者的中位 OS 時(shí)間對(duì)于高風(fēng)險(xiǎn)組為 12 個(gè)月,而對(duì)于低風(fēng)險(xiǎn)組為 23.5 個(gè)月。同樣,在 TCGA ESCC 樣本中,晚期 ESCC 患者的中位 OS 時(shí)間對(duì)于高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組分別為 13 個(gè)月和 42 個(gè)月。本研究還檢查了 TCGA ESCC 數(shù)據(jù)中上述 16 種診斷/預(yù)后標(biāo)志物的差異甲基化狀態(tài)。與正常樣本相比,其中 10 個(gè)在 TCGA ESCC 樣本中顯示出類似的甲基化變化。其余六個(gè)標(biāo)記表現(xiàn)出相似但不太強(qiáng)烈的甲基化變化。

04 確定的診斷和預(yù)后標(biāo)志物的功能意義

本研究所發(fā)現(xiàn)的一些 DMC 標(biāo)記位于蛋白質(zhì)編碼基因的啟動(dòng)子或基因體中,可能通過(guò)影響這些基因的表達(dá)而促進(jìn) ESCC 的發(fā)展或進(jìn)展。為了檢驗(yàn)這個(gè)假設(shè),本研究首先尋找甲基化水平與宿主或附近基因的表達(dá)水平相關(guān)的標(biāo)記。結(jié)果發(fā)現(xiàn)標(biāo)記的甲基化狀態(tài)與相應(yīng)宿主基因的表達(dá)水平呈負(fù)相關(guān)或者正相關(guān)。

接下來(lái),本研究將重點(diǎn)放在ESCC樣本中表達(dá)水平增加并與相應(yīng)DMC標(biāo)記的甲基化水平相關(guān)的標(biāo)志宿主基因上,假設(shè)在體外降低這些基因的表達(dá)將降低ESCC細(xì)胞的惡性程度。選擇啟動(dòng)子中帶有DMC標(biāo)記的MMP13、YEATS2HOXC10以及帶有基因體DMC標(biāo)記的NECAB2用于功能實(shí)驗(yàn)。與匹配的正常組織樣本相比,這四個(gè)基因在 ESCC 樣本中過(guò)表達(dá),并且表達(dá)水平與相應(yīng) DMC 的甲基化水平密切相關(guān)。本研究還敲低了這些基因在 ESCC 細(xì)胞系中的表達(dá)。結(jié)果發(fā)現(xiàn)siRNA沉默YEATS2、HOXC10NECAB2表達(dá)可抑制ESCC細(xì)胞增殖、遷移和侵襲;沉默 MMP13 的表達(dá)抑制 ESCC 細(xì)胞遷移和侵襲,但不抑制增殖。

小編總結(jié)

本研究使用多組學(xué)方法對(duì) 91 名中國(guó) ESCC 患者的全基因組 DNA 甲基化異常進(jìn)行了表征,支持了異常 DNA 甲基化是 ESCC 發(fā)展和進(jìn)展的重要組成部分。該研究還針對(duì)少量具有潛在功能的甲基化 CpG 位點(diǎn),這些位點(diǎn)能夠?qū)⒛[瘤與正常組織區(qū)分開(kāi)來(lái),或?qū)⒒颊叻譃楦呶;虻臀=M。使用這些 CpG 位點(diǎn),本研究構(gòu)建了用于 ESCC 分子診斷和預(yù)后的 DNA 甲基化面板,并在多個(gè)公共數(shù)據(jù)集中對(duì)其進(jìn)行了驗(yàn)證。

本研究有幾個(gè)局限性。首先,DNA甲基化分析受到微陣列固定設(shè)計(jì)的限制。其次,標(biāo)記篩選和功能驗(yàn)證僅限于主要以順式方式影響宿主蛋白編碼基因的DMCs,而DMCs可以遠(yuǎn)距離(即反式)影響,也可以對(duì)非編碼元件產(chǎn)生影響。此外,這些影響可能不是嚴(yán)格的一對(duì)一的,而是形成一個(gè)相互關(guān)聯(lián)的網(wǎng)絡(luò)。