遺傳變異可以通過改變調(diào)控元件來改變基因表達(dá),從而影響復(fù)雜性狀。然而,影響豬調(diào)控元件活性的遺傳變異很大程度上未知,這些變異在多大程度上影響基因表達(dá)和助力理解復(fù)雜表型仍不清楚。
江西農(nóng)業(yè)大學(xué)黃路生院士團(tuán)隊(duì)利用292只豬肝臟的組蛋白H3第27位賴氨酸乙?;?/span>H3K27ac)的ChIP-seq數(shù)據(jù)注釋了90991個高質(zhì)量調(diào)控元件。結(jié)合基因組重測序和RNA-seq數(shù)據(jù),共鑒定出28425個H3K27ac數(shù)量性狀位點(diǎn)(acQTL)和12250個表達(dá)數(shù)量性狀位點(diǎn)(eQTL)。通過等位基因不平衡分析在獨(dú)立數(shù)據(jù)集中驗(yàn)證了兩個因果性acQTL變異。研究觀察到基因表達(dá)和H3K27ac之間存在大量共有遺傳調(diào)控,尤其是在啟動子區(qū)域。研究人員推斷46%的H3K27ac與基因表達(dá)表現(xiàn)出伴隨關(guān)系而非因果關(guān)系。通過整合GWAS、eQTL、acQTL和轉(zhuǎn)錄因子結(jié)合預(yù)測,進(jìn)一步證明了它們通過代謝物dulcitol、磷脂酰膽堿(PC)(16:0/16:0)和已發(fā)表的表型,在鑒定可能的因果變異和基因以及發(fā)現(xiàn)亞閾值GWAS位點(diǎn)方面的應(yīng)用。研究深入了解調(diào)控元件與基因表達(dá)之間的關(guān)系,以及剖析表型分子機(jī)制的遺傳基礎(chǔ)。
結(jié)果圖形
(1)調(diào)控元件的描述和注釋
通過染色質(zhì)免疫沉淀測序(ChIP-seq)技術(shù)獲得了豬肝臟中H3K27ac的分布情況。將reads比對到豬的參考基因組(Sscrofa 11.1)。通過peaks鑒定和過濾程序,確定了每個樣本中平均77947個H3K27ac峰值。所有峰值進(jìn)一步合并成至少在三個樣本中出現(xiàn)的90991個共有峰值。在轉(zhuǎn)錄起始位點(diǎn)(TSS)1 kb范圍內(nèi)的共有峰值定義為啟動子(16544個),其他的被定義為增強(qiáng)子(74447個)。41%的H3K27ac峰值位于內(nèi)含子中,其中近三分之一是第一個內(nèi)含子。23%和18%的峰值分布在遠(yuǎn)端間基因區(qū)域和啟動子區(qū)域。近一半的峰值位于TSS附近10~100 kb范圍內(nèi)。通過與之前研究中的H3K27ac峰值比較,驗(yàn)證了這些峰值的真實(shí)性。結(jié)果顯示本研究中的30169個H3K27ac峰值覆蓋了Kern等人研究中98.6%的峰值。此外,研究者還分析了每個共有峰值的出現(xiàn)百分比與其豐度(以FPM衡量)之間的相關(guān)性,發(fā)現(xiàn)峰值的出現(xiàn)百分比與其豐度正相關(guān)。同時還鑒定了調(diào)控可能決定細(xì)胞和組織身份的基因中起重要作用的超增強(qiáng)子。本研究中每個樣本平均鑒定了1090個超級增強(qiáng)子,覆蓋寬度平均為47.2 kb。
· H3K27ac峰寬分布:H3K27ac峰的平均寬度為691 bp。紅色虛線表示平均值。
· H3K27ac共有峰:共有峰分為啟動子或增強(qiáng)子。啟動子位于基因轉(zhuǎn)錄起始位點(diǎn)附近,增強(qiáng)子位于基因內(nèi)部或遠(yuǎn)端調(diào)控區(qū)域。
· 共有峰豐度與百分比相關(guān)性:共有峰的平均每M片段數(shù)(FPM,類似于RNA中的TPM)與其在個體中出現(xiàn)的百分比之間的相關(guān)性。每個峰用一個藍(lán)色點(diǎn)表示,紅色實(shí)線為點(diǎn)的擬合。右上角的圖表通過平均值±3倍標(biāo)準(zhǔn)差(sd)去除了異常值。相關(guān)性和通過斯皮爾曼相關(guān)性計算。
· 增強(qiáng)子或啟動子的比例變化:隨著共有峰出現(xiàn)的百分比變化,增強(qiáng)子或啟動子的比例也會發(fā)生變化。
· 代表性共有超級增強(qiáng)子表征:展示了一種覆蓋脂質(zhì)代謝相關(guān)基因LDLR的代表性共有超級增強(qiáng)子。x軸表示基因組位點(diǎn),y軸表示每20bp bin的平均reads深度(以M計)。Input軌跡為陰性對照。透明的橙色矩形高亮顯示共有超級增強(qiáng)子范圍?;虮磉_(dá)豐度(TPM)顯示在符號下方。
· 增強(qiáng)子RNA(eRNAs)的外顯子數(shù)量:比較了多聚腺苷酸化的增強(qiáng)子RNA(eRNAs)與參考注釋中基因的外顯子數(shù)量。