導讀
非酒精性脂肪性肝病(NAFLD)的3D基因組和基因組變異在很大程度上是未知的,盡管它們在細胞功能和生理過(guò)程中起著(zhù)關(guān)鍵作用。在正常和NAFLD小鼠的肝臟上進(jìn)行高通量染色體構象捕獲(Hi-C)、ONT測序和rna測序(RNA-seq)測定。生成高分辨率3D染色質(zhì)相互作用圖,通過(guò)Hi-C檢測不同的3D基因組層次結構,包括A/B區室、拓撲相關(guān)結構域(TADs)和染色質(zhì)環(huán),并檢測結構變異(SVs)和拷貝數變異(CNVs)的全基因組測序。在正常和NAFLD小鼠間,發(fā)現了基因組中數千個(gè)區域在3D染色質(zhì)組織和基因組重排方面的變化,并揭示了基因調節異常經(jīng)常伴隨這些變化。在NAFLD中發(fā)現了候選靶基因,受基因重排和空間組織破壞的影響。作者的數據為NAFLD研究提供了高分辨率的三維基因組相互作用資源,揭示了遺傳重排、空間組織破壞和基因調控之間的關(guān)系,并確定了與NAFLD發(fā)病機制中這些變異相關(guān)的候選基因。這些新發(fā)現為NAFLD的發(fā)病機制提供了新的見(jiàn)解,并為NAFLD的治療提供了新的概念框架。
背景介紹
非酒精性脂肪性肝病(NAFLD)是一種常見(jiàn)的慢性肝臟疾病,與肝臟脂肪堆積有關(guān)。鑒于NAFLD發(fā)病機制的復雜性,個(gè)體基因的變異并不能在疾病的發(fā)生中起決定性作用。全基因組分析和NAFLD候選基因的披露將提高對NAFLD病理生理學(xué)的理解。rna測序(RNA-seq)和全基因組測序(WGS)是目前廣泛應用于深入了解疾病的技術(shù)。測序技術(shù)的重大進(jìn)步使得RNA-seq和WGS在確定肝臟疾病的分子發(fā)病機制方面得以實(shí)現。ONT測序作為第三代測序方法,具有較高的測序通量和更長(cháng)的讀取長(cháng)度,允許對整個(gè)基因組進(jìn)行全面分析,并識別大量的結構變異(SVs)和拷貝數變異(CNVs)。ONT測序廣泛應用于“組學(xué)”科學(xué),如基因組學(xué)、表觀(guān)基因組學(xué)和轉錄組學(xué),以評估參與疾病過(guò)程的單個(gè)或多個(gè)基因的突變狀態(tài)。sv通常存在于基因組中,但它們的功能影響往往難以捉摸。SV事件可能伴隨著(zhù)染色體三維(3D)結構的改變,破壞基因結構,導致疾病。
3D基因組的改變可能會(huì )影響許多關(guān)鍵的生物功能,它們與疾病發(fā)展的機制聯(lián)系日益明顯。在過(guò)去的幾年里,已經(jīng)進(jìn)行了一些關(guān)于3D癌癥基因組的研究。在一些腫瘤抑制基因中,包括但不限于磷酸酶和緊張素同源物(PTEN)、腫瘤蛋白p53 (TP53)、RB轉錄輔抑制因子1 (RB1)、notch受體1 (NOTCH1)和神經(jīng)纖維蛋白1 (NF1),序列或啟動(dòng)子經(jīng)常會(huì )因易位和反轉而中斷導致失活和隨后的癌癥發(fā)作和進(jìn)展。這些技術(shù)的整合有可能彌合基因組結構和基因功能之間的差距,從而對NAFLD有更深入的了解。
材料方法
無(wú)NAFLD小鼠(對照組,C)和有NAFLD小鼠(模型組,M)的肝臟樣本。
技術(shù):Hi-C測序、ONT全基因組測序、RNA-seq、qPCR
結果
1、NAFLD小鼠肝臟轉錄組
誘導小鼠發(fā)生NAFLD,結果顯示血清ALT、AST、TC、TG、FFA水平顯著(zhù)升高;MDA、SOD和GSH水平的變化表明模型組小鼠肝臟的氧化應激狀態(tài)(圖1A)。通過(guò)H&E染色和油紅O染色觀(guān)察模型組肝組織病理改變和脂質(zhì)堆積情況(圖1B)。
肝臟樣本的不同生物重復之間的高度相似性如圖1C所示??紤]所有重復,通過(guò)FPKM分析鑒定了2163個(gè)差異表達基因。在差異表達基因中,2100個(gè)基因被用于研究,這些基因可被注釋為差異表達基因(DEGs),包括1251個(gè)上調基因和849個(gè)下調基因在NAFLD小鼠中。利用GO和KEGG數據庫對獲得的差異表達基因進(jìn)行富集分析,富集程度*高的前10個(gè)GO和前20個(gè)KEGG通路分別如圖。這些結果表明在NAFLD肝臟轉錄組中存在很大比例的擾動(dòng),其中大多數與糖脂代謝相關(guān)的蛋白質(zhì)編碼基因失調。作者選擇一個(gè)差異表達基因的子集進(jìn)行qPCR驗證所選基因的表達水平結果。
2、繪制三維染色質(zhì)構象
為了獲得三維染色質(zhì)構象圖,作者對肝臟樣本的Hi-C文庫進(jìn)行了測序,每組總共獲得超過(guò)477 Gb的數據。在去除PCR重復位點(diǎn)后,每個(gè)樣本獲得了超過(guò)8.02億對有效Hi-C數據,測序深度為68.56%和68.96%,能夠以10 kb分辨率檢查C組和M組的相互作用。順?lè )词较嗷プ饔玫谋壤@示,約四分之三的相互作用發(fā)生在染色體內,四分之一的相互作用發(fā)生在染色體間質(zhì)(圖2A)。,這個(gè)頻率可以揭示染色體在基因組中的相互作用強度和染色體在細胞核中的相對位置。染色體之間的相互作用頻率熱圖如圖2C所示。通過(guò)熱圖顏色由對照組的藍色變?yōu)镹AFLD組的淺紅色,可以發(fā)現染色體Chr2與Chr5之間相互作用頻率的差異,提示NAFLD組兩染色體之間距離較近,相互作用較強。相比之下,觀(guān)察到的顏色從紅色變?yōu)樗{色,表明NAFLD組染色體之間的空間距離更遠,相互作用更弱,如Chr 7和Chr 11之間的相互作用。將各組的兩個(gè)Hi-C庫結合起來(lái),進(jìn)行對照組與模型組的對比分析。根據任意兩個(gè)bin之間覆蓋的Hi-C讀對的歸一化相互作用信號強度,繪制全基因組相互作用矩陣(圖2D),染色體內相互作用矩陣如圖所示。

圖2?用Hi-C繪制對照組和NAFLD組小鼠肝組織三維染色質(zhì)構象圖。(A)從對照組和NAFLD小鼠獲得的Hi-C庫中順式和反式相互作用的分布比例。
3、NAFLD中A/B區和相關(guān)DEGs的變化鑒定
Hi-C生成的高分辨率資源可以在多個(gè)尺度上探索NAFLD肝細胞中任何基因組位點(diǎn)的物理環(huán)境變化,如A/B區室、TAD、染色質(zhì)環(huán)等。通過(guò)PCA將染色質(zhì)分離成A/B區,以了解NAFLD肝臟基因組中染色質(zhì)相互作用模式的差異。每個(gè)樣本染色體上A/B區室的分布如圖3A。對照組肝臟基因組共鑒定出714個(gè)A區(42.93%)和722個(gè)B區(49.65%),NAFLD肝臟基因組共鑒定出819個(gè)A區(42.64%)和821個(gè)B區(49.92%)。正常和NAFLD條件下的區室高度相關(guān),NAFLD誘導后僅2.34%的基因組發(fā)生切換(圖3E)。A/B開(kāi)關(guān)區在每個(gè)染色體中的分布如圖3F所示。在所有染色體中共發(fā)生447次A/B室切換事件,其中226次A到B切換,221次B到A切換,Chr 9和Chr 13發(fā)生的室切換次數*多。將基因表達(RNA-seq)與HiC定義的A/B切換區進(jìn)行比較,發(fā)現A/B區變化與基因表達之間存在相關(guān)性(圖S4D)。通過(guò)篩選實(shí)驗組之間與A/B室切換相關(guān)的38個(gè)DEGs,發(fā)現NAFLD組中B-A室DEGs上調94.12%,A-B室DEGs下調33.33%。作者篩選了16個(gè)與B-A室開(kāi)關(guān)相關(guān)的上調deg和4個(gè)與A-B室開(kāi)關(guān)相關(guān)的下調差異基因。

圖3通過(guò)Hi-C和RNA-seq檢測NAFLD小鼠肝臟A/B區及相關(guān)DEGs的變化。
4、鑒定TADs和相關(guān)deg的變化非酒精性脂肪肝
作者用TadLib軟件在20kb分辨率下識別TADs。在對照組和模型組TAD比較中,作者在對照組中發(fā)現了8179個(gè)TAD,在NAFLD組中發(fā)現了7818個(gè)TAD,其TAD大小中位數為180 kb。TAD結構分析表明,TADs具有穩定的染色質(zhì)結構特征。方向性指數(DI)衡量了給定感興趣區域接觸方向的不平衡46,并與TAD邊界有關(guān),TAD邊界顯示出從上游到下游DI的強烈轉移特征(圖4A)。作者在對照組和NAFLD中分別識別出9390和9246個(gè)TAD邊界,其中538個(gè)為特殊控制邊界,394個(gè)為模型組邊界)。TADs在對照組和NAFLD組之間高度相關(guān),只有大約5%的TAD邊界在NAFLD發(fā)展過(guò)程中發(fā)生改變。TADs在基因表達調控中發(fā)揮重要作用,繪制了與差異TAD邊界相關(guān)的DEGs,并分析了它們的數量。圖4E所示為各組唯一TAD邊界及兩組不變邊界相關(guān)的deg。NAFLD的基因表達受到TAD邊界變化的影響,如圖4F中紅色陰影的染色體區域,以及圖4F中藍色陰影所示區域的交替。鑒定出42個(gè)上調基因和30個(gè)下調基因(支持信息圖S5和表S11)。這些結果表明,由于與NAFLD發(fā)展相關(guān)的新的TAD邊界的形成和消失,轉錄譜發(fā)生了改變。
5、染色質(zhì)環(huán)及其相關(guān)變化的鑒定NAFLD中的DEGs
除了短程染色質(zhì)相互作用外,3D基因組組織中的遠程環(huán)帶來(lái)了兩個(gè)線(xiàn)性分離的位點(diǎn)之間的物理接近。作者通過(guò)Hi-C接觸矩陣使用改進(jìn)的HICCUP方法注釋染色質(zhì)環(huán),分辨率為10 kb。結果顯示,與NAFLD發(fā)展相關(guān)的環(huán)的總數減少(從39,670到38,469,圖5A),而環(huán)的大小沒(méi)有變化(環(huán)的中位數長(cháng)度為70 kb,支持信息圖S6A。每條染色體的環(huán)分布如圖5B和C所示,Chr 1上的環(huán)分布*多,對照組和模型組分別有3193個(gè)和3099個(gè)環(huán)(圖5B)。

圖4 Hi-C和RNA-seq檢測NAFLD小鼠肝臟中TADs及受TADs影響的DEGs的變化

圖5 Hi-C和RNA-seq檢測NAFLD中染色質(zhì)環(huán)及相關(guān)DEGs的變化

圖6ONT測序鑒定的NAFLD結構變異(SV)變化。
經(jīng)分析,與對照組相比,NAFLD組無(wú)啟動(dòng)子和增強子的環(huán)數增加,在增強子和啟動(dòng)子上有錨點(diǎn)的環(huán)數減少(圖5D和E)。作者確認對照組有1924個(gè)特異性環(huán),模型組有723個(gè)特異性環(huán),FDR閾值為0.1(圖5A和支持信息表S12)。結合RNA-seq數據研究了環(huán)變異與基因表達之間的關(guān)系,98個(gè)已映射的DEGs被染色質(zhì)環(huán)變異調控,包括48個(gè)上調基因和50個(gè)下調基因。對這些環(huán)路影響的DEGs進(jìn)行GO富集和KEGG分析,確定了參與新生脂肪形成的標志性基因,如?;o酶a去飽和酶1 (Scd1)和超長(cháng)鏈脂肪酸蛋白6 (Elovl6)的延伸,它們在NAFLD中的表達下調。另一方面,在作者的研究中,形成異源二聚體并促進(jìn)膽固醇流入膽汁47的atp結合盒亞家族G成員5和8 (Abcg5和Abcg8)以及在晚期NAFLD45中報道的Fgfr2的水平在NAFLD中上調。這些發(fā)現表明染色質(zhì)環(huán)在NAFLD細胞代謝事件中的潛在作用。
6、通過(guò)ONT測序鑒定NAFLD中的SVs
ONT測序用于對NAFLD小鼠基因組變異進(jìn)行測序。經(jīng)過(guò)質(zhì)量控制,從對照和模型樣本(每組n z3個(gè))中獲得643.97 Gb清潔數據,平均清潔數據量為107.33 Gb。N50值為9.89 kb,讀取的平均長(cháng)度大于6.95 kb(支撐信息表S14)。根據參考基因組,每個(gè)樣本的映射率均在99.04%以上。測序深度和讀取覆蓋率的分布顯示了可接受的測序隨機性(圖6A和B,支持信息圖。S7B和S8)。實(shí)驗組中,有381個(gè)deg與差異sv重疊,其中與DEL重疊201個(gè)deg,與INS重疊99個(gè)deg,與INV重疊188個(gè)deg(輔助信息表S17)?;诨蚬δ?,作者發(fā)現14個(gè)svv影響的DEGs參與脂質(zhì)運輸和代謝(Acaca、Acsl5、Cbr3、Ces1f、Ces1g、Cryl1、Dgka、Dgkb、Dgkk、Idi1、Nlgn1、Nlgn3、Sugct和Hao2), 8個(gè)svv影響的DEGs與能量產(chǎn)生和轉換相關(guān)(Bckdhb、Me1、Hao2、Mt-co3、Mt-nd4、Nnt、Slc1a1和Slc1a2)。一些sv影響的DEGs與NAFLD相關(guān),這些結果暗示SVs通過(guò)影響基因調控和染色質(zhì)組織參與NAFLD的發(fā)展。

圖7通過(guò)Hi-C、Nanopore、RNA測序綜合分析,Gsta1和Camk1d為染色質(zhì)結構重組引起NAFLD的候選致病基因。?
7、通過(guò)ONT測序鑒定NAFLD中的CNVs
DNA片段的刪除或復制導致拷貝數變異(CNVs),這是基因組中正常和致病變異的重要來(lái)源。每個(gè)樣本中發(fā)現了大約150個(gè)CNVs,包括損失、增益和擴增。結合RNA-seq結果鑒定了對照組和NAFLD組之間的差異CNVs, 22個(gè)具有差異CNVs的deg(包括12個(gè)上調基因和10個(gè)下調基因)與NAFLD有關(guān)。在比較sv影響的DEGs時(shí),同時(shí)鑒定出Cntnap2、Mrgpra2b、Hist1h4n、Hist1h2br、Hist1h2ao、Pde4b、Gsta1、Gm3776、Kcnh1和Camk1d中的CNV變異。在Gsta1位點(diǎn)發(fā)現CNV差異,在NAFLD組中表達增加。由此可見(jiàn),NAFLD的基因調控機制與染色質(zhì)微環(huán)境的差異有關(guān)。
8、NAFLD中染色質(zhì)結構重組引起的致病基因候選
將Hi-C、Nanopore數據與NAFLD中的DEGs進(jìn)行整合,并通過(guò)RNA-seq、Hi-C和Nanopore測序結果的綜合分析篩選出所有受3D無(wú)序或重排影響的DEGs。與A/B區SVs、TAD、染色質(zhì)環(huán)和/或CNV相關(guān)的DEGs。在基因本體注釋中篩選出了與NAFLD發(fā)病機制相關(guān)的、存在基因組結構變異的DEGs作為潛在的候選基因,這些基因可能有助于NAFLD的發(fā)生。Elovl6下調與TAD和loop中3D結構的重組相關(guān)。Camk1d表達下調,并受到CNV和SV、染色質(zhì)環(huán)、結構域和相互作用矩陣的改變的全面影響。這些結果表明了三維基因組層次結構各個(gè)層次的功能相關(guān)性,三維基因組的建立提供了多個(gè)調控層來(lái)改變NAFLD發(fā)展中的基因表達。
結論
1、NAFLD的肝損傷伴有基因表達的改變和肝臟轉錄組的潛在重塑。證據表明不同的3D基因組層次結構具有功能相關(guān)性,3D基因組組織提供了多個(gè)額外的調控層來(lái)控制基因表達。
2、TADs是染色體的基本單位,是保守于組織和物種之間的自我接觸結構域。在NAFLD中,在繪制TADs圖時(shí),大多數TADs是保守的,然而大約5%的TAD邊界在NAFLD誘導下被破壞。篩選到變化的TADs的DEGs,并觀(guān)察到參與新生脂肪形成的標志基因Elovl6的下調與NAFLD的TAD變化有關(guān)。Plxnb1,一種肝臟腫瘤形成的抑制因子,在NAFLD中是taimpimpacted下調的DEG。
3、確定了兩組之間染色質(zhì)環(huán)的差異和98個(gè)與環(huán)變化相關(guān)的DEGs。受tad影響的基因Elovl6和Plxnb1也受到染色質(zhì)環(huán)變化的影響。環(huán)擠壓可能是導致TADs的一個(gè)機械方面。
考慮到以上因素,本研究采用了一種長(cháng)讀的ONT測序方法。作者鑒定了基因組中的所有SVs和cnv,并檢索了與NAFLD中差異SVs和cnv相關(guān)的deg。確定了381個(gè)sv影響的和23個(gè)cnv影響的與NAFLD發(fā)展相關(guān)的DEGs, Camk1d、Pde4b和Gsta1基因的調控異常是由于sv和cnv在其位點(diǎn)上的存在。此外,包括Plce1、Plxnb1、Fgfr2、Grm8、Kcnma1和sugt在內的DEGs位點(diǎn)周?chē)幕蚪M重排(SV或CNV)伴隨著(zhù)不同3D基因組層次結構的破壞。這表明在三維染色質(zhì)構象、基因組和轉錄調控中存在共同的機制,并可能影響NAFLD的肝細胞表型。
展望
目前的工作有一些局限性。三維基因組在NAFLD核過(guò)程中的調控作用有待進(jìn)一步闡明。未來(lái)需要進(jìn)行基因組編輯研究,以確定打亂各種3D組織特征的功能后果,以闡明3D基因組破壞導致NAFLD的機制。此外,破譯由組蛋白修飾、DNA甲基化和非編碼rna介導的表觀(guān)遺傳機制的組合是√確定遺傳重排和空間組織破壞所必需的,并可能揭示NAFLD的新機制和確定新的治療靶點(diǎn)。
如果您對該研究思路感興趣,歡迎點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費為您設計文章思路方案