癌癥是全球主要的公共衛(wèi)生威脅,雖然癌癥死亡率自 1991 年達(dá)到頂峰以來持續(xù)下降,但僅在 2021 年,美國就有超過 60萬人死于癌癥。2020年,全球有近1000萬人死于癌癥,近年來一些低收入和中等收入國家的死亡率有所上升。因此,抗擊癌癥的需求仍然緊迫且未得到滿足。研究表明,早期腫瘤檢測對于改善癌癥患者的預(yù)后至關(guān)重要。例如,肝細(xì)胞癌 (HCC) 的早期診斷時的五年生存率為 34%,但晚期診斷(遠(yuǎn)端轉(zhuǎn)移)時,其生存率則降至3%。因此,開發(fā)用于早期癌癥檢測的檢測方法至關(guān)重要。血漿中的細(xì)胞游離細(xì)胞DNA(cell-free DNA,cfDNA)是腫瘤檢測的潛在生物標(biāo)志物,但其中存在于約10%CpG二核苷酸中的半甲基化(hemi-methylation)模式尚未得到充分研究。
研究通過cfMeDIP-seq結(jié)合機(jī)器學(xué)習(xí)方法分析了肝臟腫瘤和血漿游離DNA(cfDNA)中的差異半甲基化區(qū)域(DHMRs),揭示了大多數(shù)DHMRs與相同樣本中的差異甲基化區(qū)域(DMRs)不重疊,表明DHMRs可以作為獨(dú)立的生物標(biāo)志物。同時,通過分析患有肝癌或腦癌的個體樣本以及無癌癥個體樣本(對照組)共計215例樣本的cfDNA甲基化組,并利用DMRs、DHMRs或DMRs+DHMRs兩者訓(xùn)練機(jī)器學(xué)習(xí)模型。結(jié)合DMRs+DHMRs的模型,比只使用DMRs或DHMRs訓(xùn)練的模型表現(xiàn)出更優(yōu)越的性能,在驗證隊列中,區(qū)分對照組、肝癌和腦癌的AUROC值分別為0.978、0.990和0.983。這項研究支持了同時利用DMRs和DHMRs進(jìn)行多癌種檢測的潛力。
標(biāo)題:Tumor detection by analysis of both symmetric- and hemi-methylation of plasma cell-free DNA(通過分析血漿cfDNA的對稱甲基化和半甲基化來檢測腫瘤)
研究思路:
l 利用改進(jìn)版甲基化DNA免疫沉淀測序(MeDIP-Seq)方法,分析來自肝臟腫瘤和腦腫瘤患者以及健康對照組的血漿cfDNA樣本。
l 研究對稱甲基化(symmetric methylation)和半甲基化(hemi-methylation)在腫瘤檢測中的獨(dú)立作用。
方案設(shè)計:
本研究通過分析肝癌患者、腦癌患者和健康對照者共計215例樣本的cfDNA甲基化組圖譜,并利用DMRs、DHMRs及兩者結(jié)合訓(xùn)練機(jī)器學(xué)習(xí)模型。
開發(fā)兩種甲基化DNA免疫沉淀和鏈特異性(strand-specific,ss)測序方法(MeDIP-Seq):基于基因組DNA的ssg-MeDIP-Seq和基于血漿cfDNA的sscf-MeDIP-Seq。使用pA-Tn5轉(zhuǎn)座酶進(jìn)行DNA片段化和鏈特異性標(biāo)記。
使用機(jī)器學(xué)習(xí)模型:訓(xùn)練并分析基于差異甲基化區(qū)域(DMRs)和差異半甲基化區(qū)域(DHMRs)的數(shù)據(jù)集。使用GLMnet、隨機(jī)森林和深度神經(jīng)網(wǎng)絡(luò)(DNN)進(jìn)行模型訓(xùn)練和驗證。
研究亮點:
本研究結(jié)果揭示大多數(shù)DHMRs與相同樣本中的DMRs不重疊,表明DHMRs可以作為獨(dú)立的生物標(biāo)志物。訓(xùn)練的機(jī)器學(xué)習(xí)模型結(jié)合DMRs和DHMRs顯示出比單獨(dú)使用DMRs或DHMRs更好的性能,尤其是在區(qū)分對照組、肝癌和腦癌方面。
表明利用DMRs和DHMRs作為生物標(biāo)志物,通過sscf-MeDIP-Seq方法分析血漿cfDNA,可以提高多癌種檢測的準(zhǔn)確性。研究支持將cfDNA甲基化和半甲基化分析作為癌癥早期檢測和分類的潛在手段。
本研究創(chuàng)新性地開發(fā)了sscf-MeDIP-Seq方法,能夠同時分析cfDNA的對稱甲基化和半甲基化。證明了DHMRs作為獨(dú)立生物標(biāo)志物在腫瘤檢測中的潛力。機(jī)器學(xué)習(xí)模型的結(jié)合使用DMRs和DHMRs提高了腫瘤檢測的準(zhǔn)確性(尤其是在獨(dú)立驗證隊列中)。研究提供了一種新的策略,通過分析血漿cfDNA的甲基化模式來檢測和分類腫瘤,具有潛在的臨床應(yīng)用價值。