在疾病篩查和診斷領(lǐng)域,細胞游離DNA(cfDNA)已經(jīng)成為一種具有巨大臨床應用價值的液體活檢生物標志物。相比cfDNA,細胞游離RNA(Cell-free RNA,cfRNA)的研究則相對較少。然而,基于cfRNA的液體活檢技術(shù)也具有一些優(yōu)點,例如可追溯疾病發(fā)生的組織來源、為低腫瘤DNA脫落的患者提供早篩可能和檢測基因融合。
cfRNA是一種轉(zhuǎn)錄本混合物,來源于身體的各個器官和細胞。目前,cfRNA在腫瘤、骨髓移植、肥胖、神經(jīng)退行性疾病和肝相關(guān)疾病已有相關(guān)的研究和應用。然而,cfRNA的細胞起源仍然未知。眾所周知,細胞病理學變化是疾病發(fā)生的重要基礎(chǔ),而利用基于cfRNA的液體活檢來探究細胞的起源,將為疾病的病理機制研究提供一種無創(chuàng)檢測手段。
研究結(jié)果
1. 利用單細胞表達譜數(shù)據(jù)識別cfRNA的細胞類型
本研究首先繪制了正常人血漿的細胞游離外顯子轉(zhuǎn)錄組特征圖譜(圖 1a)。在對一些低質(zhì)量的樣本進行過濾后,共納入75份正常人樣本。接著,在cfRNA中對PanglaoDB數(shù)據(jù)庫每種細胞類型特征基因的表達量進行檢查和基因數(shù)統(tǒng)計。與組織水平的表達數(shù)據(jù)類似,來自血液、大腦和肝臟細胞的標記基因都能檢測到,同時也發(fā)現(xiàn)了來自腎臟、胃腸道和膀胱細胞的基因。
為了明確cfRNA存在的細胞類型,研究者使用支持向量回歸(support vector regression,SVR)對細胞類型特異的RNA組分進行反卷積。這里的反卷積是指利用算法和單個細胞的表達譜特征,從組織的表達譜數(shù)據(jù)中推斷細胞的占比情況。的反卷積算法應用案例是CIBERSORT工具,它可以從腫瘤組織表達譜中預測腫瘤浸潤免疫細胞類型和比例。為了更好地進行反卷積,作者利用TSP(Tabula Sapiens version 1.0)單細胞轉(zhuǎn)錄組圖譜數(shù)據(jù)庫,建立一個基因集基矩陣,作為參考信號矩陣。TSP是迄今為止為龐大的人類泛器官單細胞轉(zhuǎn)錄組圖譜數(shù)據(jù)庫。這個基矩陣包含明確細致的細胞類型和用于注釋細胞的小判別基因集。斯皮爾曼相關(guān)性分析顯示,在基矩陣中,來自相同組織成分的細胞類型會形成聚類。同時,利用該矩陣,對多個組織的bulk轉(zhuǎn)錄組數(shù)據(jù)進行反卷積,能夠精確地區(qū)分細胞類型并表現(xiàn)出很好的性能。均方根誤差(Root Mean Square Error,RMSE)用于評估該算法預測值與真實值之間的偏差。預測值和真實值的相關(guān)性利用皮爾森相關(guān)性分析。結(jié)果表明,血液的RMSE值小和相關(guān)性強,而大腦組織的RMSE大和相關(guān)性弱。
基于該矩陣,研究者定義了血漿cfRNA表達譜中的細胞亞型。結(jié)果表明,在所有的細胞亞型中,血小板,紅細胞/紅系祖細胞和白細胞占大多數(shù),各自的比例與先前報道的血清cfRNA和血漿cfDNA研究基本一致(圖3)。有趣的是,研究者發(fā)現(xiàn)占比大的細胞類型是血小板,而不是巨核細胞,這與已有的研究在差異,可能與使用參考數(shù)據(jù)的細胞注釋方式有關(guān)。在非造血細胞中,來源于腸道、肝臟、肺部、膀胱、心臟和腎的細胞之間具有明顯的轉(zhuǎn)錄特征差別。受限于TSP數(shù)據(jù)庫,一些組織的細胞類型并未在血漿cfRNA表達譜反卷積結(jié)果中發(fā)現(xiàn)。為了找到未被鑒定的細胞類型,研究者利用人類蛋白數(shù)據(jù)庫(Human Protein Altas,HPA)也建立一個基因集矩陣,并與之前的矩陣作交集,結(jié)果表明,未發(fā)現(xiàn)細胞類型來源于大腦和睪丸,原矩陣也存在一些血液、骨骼肌和淋巴器官特異的基因未納入的情況。
為進一步分析在反卷積過程中未鑒定的細胞類型,研究者聯(lián)合使用大腦的單細胞轉(zhuǎn)錄組圖譜數(shù)據(jù)和HPA數(shù)據(jù)庫數(shù)據(jù),并提出signature score的方法,用于量化cfRNA細胞類型的表達。signature score計算的是所有細胞特異基因經(jīng)CPM-TMM歸一化且log10轉(zhuǎn)化后的count值之和。細胞的signature score值越大,說明該細胞類型在外周血中的轉(zhuǎn)錄信號越強。
反卷積后共鑒定到五種細胞類型,分別是星形膠質(zhì)細胞(Astrocyte,Ast),興奮性神經(jīng)元(Excitatory neurons,Ex),抑制性神經(jīng)元(Inhibitory neuron,In),少突神經(jīng)膠質(zhì)細胞(Oligodendrocyte,Oli),少突神經(jīng)膠質(zhì)細胞祖細胞(oligodendrocyte precursor cell,Opc)。計算這些細胞signature score后發(fā)現(xiàn),興奮型神經(jīng)元得分高,緊接其后的依次是Oli、Ast、Opc和In。膠質(zhì)細胞可維持大腦內(nèi)部穩(wěn)態(tài)、形成髓磷脂、參與神經(jīng)元的結(jié)構(gòu)形成和起到支撐作用。血漿中膠質(zhì)細胞cfRNA的發(fā)現(xiàn)可能與RNA跨膜轉(zhuǎn)運、血腦屏障的通透性改變和一些腦部區(qū)域與血液直接的原因有關(guān)。之后,研究者利用胎盤、腎臟和肝臟的細胞圖譜去進行cfRNA的細胞類型鑒定和signature score量化。這些發(fā)現(xiàn)表明,cfRNA不僅可以反映特定組織的表達譜特征,而且還可以深入到細胞類型層面。另外,cfRNA可用于描繪疾病發(fā)生前細胞轉(zhuǎn)錄狀態(tài)的基線特征。
2. cfRNA反映疾病發(fā)生的細胞病理特征
疾病的病理性改變往往是特定細胞引起,那么利用cfRNAs識別的細胞類型能否反映疾病發(fā)生或進展的細胞特征呢?研究者利用已建立的反卷積模型,分別對先兆子癇的滋養(yǎng)層、慢性腎臟?。╟hronic kidney disease,CKD)的近端小管、酒精性脂肪性肝炎(NASH)或非酒精性脂肪肝?。∟AFLD)的肝細胞和阿爾茨海默病多個腦細胞的cfRNA特征譜進行研究。在先兆子癇的研究中,主要關(guān)注的是絨毛外滋養(yǎng)層細胞(Extravillous trophoblast,EVT)和合胞體滋養(yǎng)層(Syncytiotrophoblast,SCT),然而,由這兩種細胞定義的signature score無法區(qū)分先兆子癇組和正常血壓組患者,以及早發(fā)型和晚發(fā)型先兆子癇(圖 6)。主要原因可能與研究者的模型與原文定義這兩種細胞的基因不同有關(guān)。不過,在其他的三種疾病中,cfRNA的表達譜特征都能用于區(qū)分疾病不同的病理狀態(tài)。
CKD研究共納入9名CKD患者和3名正常對照患者。與健康對照組相比,CKD患者組(年齡在67-91歲,CKD分期在3-5期,需要腹膜透析)位于近端小管細胞signature score顯著降低(圖 7)。近端小管細胞是腎臟的主要組成細胞,代謝活躍,而近端小管細胞的損傷是CKD發(fā)生的主要原因之一。肝脂肪變性是指肝臟的肝細胞胞漿內(nèi)出現(xiàn)脂肪滴,往往會導致肝細胞死亡。在NAFLD的血清cfRNA中,可檢測到編碼細胞色素P450基因(CYP1A2、CYP2E1和CYP3A4)、脂質(zhì)分泌相關(guān)基因(MTTP)和肝因子基因(AHSG和LECT2)的表達差異顯著。進一步比較健康組(n=16)、NAFLD(n=46)和NASH組(n=163)的肝細胞signature score,發(fā)現(xiàn)NAFLD和NASH組的score顯著高于健康組,但NAFLD和NASH組之間并沒有差異。神經(jīng)元死亡和突觸丟失是導致AD發(fā)生的原因之一。在AD的研究中,研究者選擇兩個腦的單細胞轉(zhuǎn)錄組數(shù)據(jù)對血漿cfRNA圖譜進行腦部細胞定義,其中,由于抑制型神經(jīng)元檢測到細胞特異基因數(shù)較少,選擇不納入組間差異分析。結(jié)果表明,與正常對照組(n=18)相比,在AD(n=40)的血漿中,存在大量差異顯著的細胞特異基因,包括星形膠質(zhì)細胞特異基因(GFAP和GRIN2C)、興奮型神經(jīng)元特異基因(SLC17A7、SLC8A2、CDH8、CDH22和GRM1)、少突膠質(zhì)細胞特異基因(MOBP和CNTN2)和少突膠質(zhì)細胞祖細胞(OLIG2、MYT1、CSPG5和BCAN)。進一步比較AD患者和無認知障礙健康對照(NCIs)以上四種細胞的signature score,發(fā)現(xiàn)這些細胞的score在AD組都顯著降低,這一現(xiàn)象與AD患者中神經(jīng)元死亡和增殖抑制的病理機制是一致的。這些結(jié)果表明,cfRNA表達譜可以作為一種無創(chuàng)的手段,用于檢測疾病相關(guān)細胞特異的病理變化。
結(jié)語
本研究闡明了cfRNA用于疾病細胞病理變化進行無創(chuàng)檢測的可能性,并在已有的研究基礎(chǔ)上進一步證實了免疫細胞和造血組織是cfRNA主要貢獻者,以及發(fā)現(xiàn)了cfRNA可以檢測到來自大腦、肺組織、腸、肝臟和腎的細胞信號。該研究也是對近期Ronen Sadeh 等研究者發(fā)表的利用血液核小體信息識別細胞身份和病理變化一種補充。未來,cfRNA包含的細胞轉(zhuǎn)錄特征信號有望成為一種無創(chuàng)檢測生物標志物,用于監(jiān)測疾病發(fā)生進程和體內(nèi)藥物反應。