01摘要
腫瘤異質(zhì)性對(duì)癌癥的個(gè)性化診斷和治療提出了挑戰(zhàn)。癌癥特異性生物標(biāo)志物的鑒定方法對(duì)于癌癥類型的診斷和治療具有重要應(yīng)用。在這項(xiàng)研究中,作者分析了來自 TCGA 和 GEO 的泛癌 DNA 甲基化數(shù)據(jù),并提出了一種基于 G 蛋白偶聯(lián)受體相關(guān)基因(GPCRs-related genes)的 DNA 甲基化水平來量化特異性程度的計(jì)算方法。并鑒定泛癌中的特定 GPCR DNA 甲基化生物標(biāo)志物 (GRSDMs)。然后,使用基于嶺回歸的方法通過預(yù)測癌癥樣本的藥物敏感性來發(fā)現(xiàn)潛在的藥物。
02介紹
癌癥的診斷可以降低癌癥死亡率,目前癌癥的診斷方法已經(jīng)開發(fā)了多種生物標(biāo)志物。然而,癌癥之間存在廣泛的異質(zhì)性,因此,開發(fā)泛癌之間的生物標(biāo)志物可以減少一定的檢測步驟和成本,也可以更容易地指導(dǎo)臨床診斷和預(yù)后。
G 蛋白偶聯(lián)受體 (GPCRs) 涉及控制腫瘤的起始和進(jìn)展。 GPCRs是大的細(xì)胞膜受體家族,臨床醫(yī)學(xué)中近一半的分子藥物靶向GPCRs信號(hào)治療中樞神經(jīng)系統(tǒng)、心血管系統(tǒng)和代謝系統(tǒng)的各種疾病。盡管對(duì)癌癥中GPCRs的藥物靶點(diǎn)和預(yù)后生物標(biāo)志物的研究逐漸深入,但GPCRSs與惡性表型的生物學(xué)相關(guān)性意味著GPCRs在癌癥中并沒有被安全探索。 GPCRs 相關(guān)基因作為癌癥特異性特征的應(yīng)用將是有希望的。
表觀遺傳機(jī)制有助于癌癥的發(fā)生和發(fā)展,DNA甲基化具有組織特異性,在組織分化中起決定性作用,被廣泛用作癌癥診斷和治療的生物標(biāo)志物。而且DNA甲基化被證實(shí)參與了癌癥的早期階段,與正常發(fā)育和生長有關(guān),在腫瘤中經(jīng)常伴隨失調(diào)。另外啟動(dòng)子區(qū)域DNA甲基化與腫瘤發(fā)生密切相關(guān),研究證明啟動(dòng)子甲基化影響診斷和治療。因此,GPCRs相關(guān)基因的DNA甲基化水平將揭示泛癌的特定生物學(xué)差異,并成為早期可靠的生物標(biāo)志物。
在本研究中,基于GPCRs相關(guān)基因的DNA甲基化水平,開發(fā)了一種計(jì)算方法來量化特異性程度,并在泛癌中識(shí)別GRSDMs,為泛癌的診斷和治療提供了前景。
03材料和方法
(1)數(shù)據(jù)來源:本研究從TCGA數(shù)據(jù)庫下載了33種癌癥類型的DNA甲基化數(shù)據(jù),以及相應(yīng)樣本的生存數(shù)據(jù),以及GEO數(shù)據(jù)庫中總共11種癌癥和正常DNA甲基化數(shù)據(jù);利用MSigDB數(shù)據(jù)庫中GPCRs通路基因集作為GPCRs相關(guān)基因。
(2)識(shí)別差異甲基化位點(diǎn)和基因:將TCGA中每種癌癥類型的DNA甲基化病例與GEO中相應(yīng)的癌癥類型數(shù)據(jù)進(jìn)行分批,使β值符合均勻分布。將每種類型的癌癥樣本隨機(jī)分為7:3,作為訓(xùn)練集和測試集。應(yīng)用t檢驗(yàn)在每個(gè)癌癥類型中篩選差異甲基化位點(diǎn),然后根據(jù)平臺(tái)注釋信息將差異甲基化位點(diǎn)映射到基因。
(3)差異甲基化基因的功能注釋:通過“ClusterProfiler”R包進(jìn)行GO和KEGG注釋。
(4)差異DNA甲基化位點(diǎn)的特征選擇:使用“Boruta”算法對(duì)差異DNA甲基化位點(diǎn)進(jìn)行選擇,以獲得癌癥類型的特征DNA甲基化位點(diǎn)。使用不同特征DNA甲基化位點(diǎn)集構(gòu)建決策樹分類器,分別區(qū)分不同癌癥類型和正常樣本。曲線下面積(AUC)用于評(píng)估模型的性能。
(5)泛癌特異性GPCR相關(guān)DNA甲基化基因(GRSDMs)的鑒定:
是每種癌癥中特征DNA甲基化基因的平均值,
是將每個(gè)特征DNA甲基化基因輸入QDMR后獲得的熵值,
相關(guān)基因i在癌癥N之間的甲基化概率,S是代表每種癌癥的樣本數(shù)量。
為了消除癌癥內(nèi)部樣本之間的異質(zhì)性,本研究還計(jì)算了每個(gè)癌癥中所有基因的平均值和每種癌癥類型的基因變異系數(shù)。
本研究構(gòu)建了癌癥基因特異性值的解離公式,定性測量癌癥的特異性和特異性DNA甲基化基因,使每個(gè)特異性DNA甲基化基因只對(duì)應(yīng)一種癌癥類型。Ti,N(max)和Ti,N(min)分別是對(duì)應(yīng)于所有癌癥的每個(gè)基因的特定值中的大值和小值。被用作識(shí)別癌癥的特定DNA甲基化基因標(biāo)記GRSDMs的指標(biāo),與所有癌癥對(duì)應(yīng)的每個(gè)基因的計(jì)算大值表示癌癥的特定DNA甲基化基因標(biāo)記。
(6)生存分析:基于無進(jìn)展生存期(PFS)的泛癌特異性DNA甲基化基因進(jìn)行生存分析,p值<0.05被用作分析預(yù)后基因的閾值。
(7)與藥物靶點(diǎn)的相關(guān)性分析:本研究從GDSC數(shù)據(jù)庫下載了198種藥物的IC50值,使用“oncoPredict”R包根據(jù)mRNA基因表達(dá)數(shù)據(jù)預(yù)測TCGA每個(gè)樣本的IC50。應(yīng)用Spearman相關(guān)性分別計(jì)算藥物IC50值與經(jīng)驗(yàn)證的GRSDMs DNA甲基化水平的相關(guān)性,以尋找治療GRSDMs的潛在有效藥物。
04結(jié)果
1)泛癌中與GPCR相關(guān)的DNA甲基化基因景觀
本研究分析了所有GPCRs相關(guān)基因的DNA甲基化水平,進(jìn)行了Kruskal-Wallis檢驗(yàn),以檢查泛癌中GPCR相關(guān)基因的DNA甲基化水平差異。在泛癌層面上,GPCRs相關(guān)基因的DNA甲基化水平存在差異(p< 0.05)。
2)泛癌特征DNA甲基化基因的獲得
為了獲得泛癌中的GRSDM,本研究首先在訓(xùn)練集中分析了每種類型癌癥的差異DNA甲基化位點(diǎn),并獲得了總共26個(gè)差異DNA甲基化位點(diǎn)和基因集。這些差異DNA甲基化基因進(jìn)行了功能富集,并在cAMP信號(hào)通路和Rap1通路等中富集。采用“Boruta”方法篩選特征性差異DNA甲基化位點(diǎn)/基因,獲得26個(gè)泛癌特征性DNA甲基化位點(diǎn)/基因,結(jié)果如圖2C所示。將訓(xùn)練集上的3283個(gè)特征DNA甲基化基因和1382個(gè)GPCRs相關(guān)基因相交,獲得169個(gè)泛癌中GPCR相關(guān)的特征DNA甲基化基因,然后用于構(gòu)建決策樹分類器,以測試特征DNA甲基化位點(diǎn)的分類性能,在測試集上,多達(dá)25種癌癥類型(如ACC)的分類模型AUC達(dá)到1.0。
3)識(shí)別泛癌特異性GPCR相關(guān)DNA甲基化基因(GRSDMs)
接下來本研究計(jì)算了每種癌癥類型中的特異基因。結(jié)果表明,有三種癌癥只有一個(gè)特異的DNA甲基化基因,如乳腺癌(BRCA)、宮頸鱗癌和宮頸腺癌(CESC)、胃腺癌(STAD)。四種癌癥有超過10種特異的DNA甲基化基因,如結(jié)腸癌(COAD)、THCA、胸腺瘤(THYM)和UVM。為了更好地分類癌癥類型,本研究使用169個(gè)GRSDMs構(gòu)建了一個(gè)隨機(jī)森林來診斷癌癥,模型的AUC在測試集上可以達(dá)到0.88,在GEO數(shù)據(jù)集上可以達(dá)到0.829。
4)特異性DNA甲基化基因的預(yù)后分析
為了篩選與預(yù)后相關(guān)的特異性DNA甲基化基因,本研究使用每種癌癥169個(gè)特異性DNA甲基化基因的平均β值作為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組的閾值。本研究獲得了22個(gè)特定的DNA甲基化基因,使高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組的生存曲線分離(p<0.05)。
5)GEO中特異性DNA甲基化基因的驗(yàn)證
為了驗(yàn)證可靠的GRSDM,在11組GEO數(shù)據(jù)上驗(yàn)證了訓(xùn)練集中獲得的22個(gè)與預(yù)后相關(guān)的特異性DNA甲基化基因,并在泛癌中驗(yàn)證了8個(gè)特異性DNA甲基化基因。
6)基于泛癌特異性DNA甲基化基因的潛在藥物選擇
由于GRSDMs可以解釋泛癌的異質(zhì)性,因此基于特定DNA甲基化基因分析與藥物敏感性的關(guān)系,以選擇不同癌癥類型的潛在藥物并改善預(yù)后。本研究共篩選出4個(gè)與12種相關(guān)藥物相關(guān)的GRSDM。
05討論
本研究獲得并驗(yàn)證了八種特異的GPCRs相關(guān)DNA甲基化基因來診斷四種癌癥類型。研究表明,識(shí)別癌癥特異性生物標(biāo)記物對(duì)癌癥診斷很重要,并可以為癌癥治療與藥物選擇提供新的方向。