本研究使用一組基因敲除的人類(lèi)胚胎干細胞(ESC)系,利用二代和nanopore三代DNA甲基化測序技術(shù),分析了DNA甲基化轉移酶reader和DNA去甲基化酶eraser對DNA甲基化景觀(guān)的獨立和組合影響。比較了14種不同的人ESC品系野生型(WT)和敲除型的全基因組甲基化水平,發(fā)現TET酶被集中招募到整個(gè)基因組中成千上萬(wàn)的體細胞增強子,但是只要存在DNMT3,TET酶就在多能細胞中保持高度甲基化。TETs在整個(gè)基因組中也具有更廣泛的活性,需要DNMT3表達來(lái)維持穩態(tài)甲基化水平??傊?,不同類(lèi)別的酶在基因組局部和整體是競爭關(guān)系。
研究背景
哺乳動(dòng)物基因組通常顯示高水平的CpG甲基化,除了大多數CpG密集的啟動(dòng)子區域,以及某些在發(fā)育上重要的增強子區域。體細胞DNA甲基化態(tài)勢總體穩定地傳播,而與衰老和疾病相關(guān)的全局模式發(fā)生了變化。相反,細胞分化過(guò)程中CpG甲基化的發(fā)育調節通常反映了對轉錄因子結合的局部重編程。
從頭DNA甲基轉移酶DNMT3A和DNMT3B負責添加甲基以生成5-甲基胞嘧啶(5mC),而DNMT1則主要用于傳播預先建立的DNA復制修飾。相比之下,TET酶(TET1,TET2和TET3)氧化5-甲基胞嘧啶,生成5-羥甲基胞嘧啶(5hmC)或進(jìn)一步的氧化物,去除甲基基團。從頭甲基化和去甲基化對于正常發(fā)育都是必不可少的,敲除會(huì )導致胚胎或產(chǎn)后早期致死。每種酶似乎發(fā)揮特定角色作用,例如,DNMT3B優(yōu)先募集到衛星重復序列和轉錄活躍基因;DNMT3A似乎在低甲基化增強子的周?chē)?,被稱(chēng)為“峽谷”的延伸的低甲基化結構域和發(fā)育平衡的啟動(dòng)子上,TET1和TET2起相反作用以維持低甲基化狀態(tài);TET2可能還具有調節轉錄延伸的功能。
尚無(wú)研究直接比較喪失所有去甲基酶和甲基轉移酶化對轉錄和基因組調控以及細胞活性的影響。為了檢查去除所有DNA甲基化活性調節蛋白的分子后果,作者生成了在DNMT3A和-3B以及所有3個(gè)TET蛋白均缺失的五元敲除( pentuple-knockout,PKO)人類(lèi)ESC進(jìn)行相關(guān)研究。
研究方法
構建DNMT 2個(gè)蛋白和TET 3個(gè)蛋白分別敲除或共敲除的人胚胎干細胞系ESC;
二代WGBS:檢測CpG甲基化水平以及與WT相比分析差異甲基化區域DMR,鑒定DNMT3A/3B敲除ESC中保守的DMR:c-DKO-DMR;TET敲除ESC中c-DKO-DMR分析;TET敲除后重新過(guò)表達TET分析甲基化水平;小鼠ESC相關(guān)細胞系檢測甲基化分析保守性;
nanopore三代DNA測序分析甲基化和結構變異SV:評估純合L1Hs元件DNA全長(cháng)序列甲基化狀態(tài);
全基因組氧化亞硫酸氫鹽測序(oxBS)分析5hmC甲基化修飾;
ENCODE和其他公開(kāi)發(fā)表chip-seq數據分析組蛋白修飾等染色體分布;其他已發(fā)表甲基化數據輔助分析;
DKO細胞RNA-seq ?分析c-DKO-DMR與基因表達關(guān)系;
hairpin亞硫酸氫鹽測序分析是否雙鏈對稱(chēng)甲基化;
研究結果
1.DNMT3缺失時(shí)TET驅動(dòng)基因組全局去甲基化

圖1上
2.多能細胞中DNMT和TET之間的局部競爭
為了進(jìn)一步研究這種甲基化缺失,接下來(lái)從另一個(gè)人類(lèi)ESC系(HUES64)(包括2個(gè)獨立的DKO克?。ˋ和B))WT和DKO細胞進(jìn)行了甲基化測序,并將甲基化水平與先前衍生的18個(gè)單DNMT3A-/-(3AKO)和單DNMT3B-/-(3BKO)敲除數據作比較(圖1b)。兩種不同的雄性WT ESC似乎具有可比性,具有相似的整體甲基化平均值(HUES64,0.79;HUES8,0.78),并且在1kb分辨率上具有較高的相關(guān)性(Pearson系數=0.93)。有趣的是,盡管第22代的單DNMT3基因敲除仍保持高度甲基化(3AKO,0.81;3BKO,0.79),但2個(gè)HUES64 DKO克隆僅經(jīng)過(guò)3代后甲基化降低至0.70(圖1b)。當我們以堿基對的分辨率檢查數據時(shí),觀(guān)察到2個(gè)不同的動(dòng)態(tài)類(lèi)別:0.1-0.2的細微下降,影響了整個(gè)基因組范圍內約10%的CpG,以及,在CpG島內局部發(fā)生的甲基化幾乎完全喪失的CpG位點(diǎn)(圖1c)。使用嚴格的標準(甲基化差異> 0.6,P <0.01,F檢驗)來(lái)定義差異甲基化區域(DMR)。DKO-DMR在3個(gè)DKO譜系上都非常一致(圖1c,d)。因此,定義了在所有3個(gè)樣品中均被甲基化的“一致性”的11,430個(gè)cDKO-DMR,cDKO-DMR始終保持較低水平(平均WT,0.749;DKO,0.086),平均長(cháng)度為688個(gè)堿基對(bp)。WT ESC中大約三分之一cDKO-DMR鄰近低甲基化區域,例如CpG島和轉錄起始位點(diǎn)(稱(chēng)為“1類(lèi)”),而其余的cDKO-DMR則位于其他高度甲基化的區域(內含子或基因間),具有明顯的高甲基化邊界(稱(chēng)為“第2類(lèi)”;圖1e–h)。幾乎所有的cDKO-DMR(93%)都被DNMT3A或-3B甲基化,僅在DKO中被完全去甲基。
圖1下
由于這些結果強烈暗示了一種主動(dòng)的去甲基化機制,作者研究了在TET敲除的HUES8細胞系(TKO,QKO和PKO)中cDKO-DMR的甲基化水平。在沒(méi)有TET的情況下,先敲除DNMT3B,然后再敲除DNMT3A,不會(huì )導致cDKO-DMR去甲基化(圖1i)。即使經(jīng)過(guò)20次傳代,PKO細胞中cDKO-DMR甲基化水平也僅微弱下降。此外,在TKO細胞中,許多1類(lèi)cDKO-DMR周?chē)膮^域獲得了甲基化,這進(jìn)一步暗示了局部去甲基化過(guò)程中的TET活性??傊?,人類(lèi)多能性細胞中有一些依賴(lài)于DNMT3A或-3B的獨特且高度甲基化的區域,這些區域在缺少它們的情況下會(huì )經(jīng)歷快速的TET介導的去甲基作用。
3.TET在cDKO-DMR處顯示持續的活性
為了驗證cDKO-DMR是否依賴(lài)并持續誘導TET活性,利用PiggyBac轉座將外源TET1(短isoform簡(jiǎn)稱(chēng)TET1s)、TET2和TET3重新引入PKO細胞中,并使用WGBS測量了總體甲基化水平(圖2a)。在異位表達每種蛋白質(zhì)后,PKO細胞的總體平均甲基化水平從第20代的0.73明顯降低到了異位表達每種蛋白質(zhì)后的0.61、0.59和0.54,而僅用轉座酶轉染的對照細胞保持穩定(平均值=0.70;圖2b)。重新引入任何TET酶可在很大程度上恢復TKO細胞中異常高甲基化的區域,誘導快速的cDKO-DMR去甲基化(圖2c-e)。從機理的角度來(lái)看,TET1s亞型缺乏CXXC結構域,無(wú)法募集至未甲基化的CpG密集區域,但TET1和TET2 rescue結果之間無(wú)明顯差異,支持了CXXC結構域無(wú)關(guān)的募集機制。TET及其作用相反的酶在cDKO-DMRs上的持續動(dòng)態(tài)也得到了已發(fā)表的染色質(zhì)免疫沉淀的支持,隨后進(jìn)行ChIP-seq,該數據表明WT ESC中DNMT3B和TET1均富集,盡管富集在比相當狹窄且定義明確的cDKO-DMR邊界更寬區域。最后,進(jìn)行了全基因組氧化亞硫酸氫鹽測序(oxBS),并在WT細胞中發(fā)現了5hmC的顯著(zhù)局部富集(平均cDKO-DMRs,0.07;背景,0.01;圖2f)。
圖2
綜上所述,這些結果證實(shí),TET酶被持續招募到整個(gè)基因組中成千上萬(wàn)個(gè)基因座,并且如果不存在DNMT3活性,則可以指導快速、局部去甲基化。
4.進(jìn)化上年輕的反轉錄轉座子中動(dòng)態(tài)募集DNMT-TET
cDKO-DMR改變穩健而√確地改變其甲基化狀態(tài)方式表明它們可能與調控元件重疊。一個(gè)小的子集包括L1Hs或L1PA長(cháng)散布的核元件(LINEs)的5’非翻譯區(UTR),它們充當其功能啟動(dòng)子,DNMT3敲除后通常顯示出進(jìn)化年齡和CpG密度依賴(lài)性去甲基(圖3a,b)。這些區域在WT ESC中還顯示出高于預期的5hmC富集,支持連續的TET募集(圖3b)。為了進(jìn)一步研究,專(zhuān)注于人類(lèi)特異性的L1Hs元件,并使用牛津納米孔的MinION平臺生成長(cháng)reads(平均長(cháng)度=8.9kb),從而能夠z確比對和評估HUES64 ESC WT和DKO,以及HUES8 ESC WT,TKO和PKO的LINE特異性甲基化狀態(tài)。(用nanopolish檢測了甲基化以及sniffle軟件分析SV,sniffile鑒定到的L1Hs元件有純合、雜合或缺失,只有純合且長(cháng)度至少為6kb的用于后續分析。)在野生型細胞中,7%的L1Hs 5’UTR(每個(gè)樣品中全長(cháng)覆蓋reads條數為207)已經(jīng)被低甲基化(圖3c)。盡管經(jīng)常沒(méi)有通過(guò)嚴格的DMR判斷標準,但在DNMT3A和DNMT3B敲除后91%的WT甲基化元件被去甲基(圖3c)。去甲基化依賴(lài)于TET表達,只有一小部分在PKO細胞中顯示丟失(圖3c)。根據它們的甲基化動(dòng)力學(xué)劃分單個(gè)LINE后,無(wú)法查明與甲基化狀態(tài)一致的任何單核苷酸多態(tài)性,這表明DNMT/TET募集背后的機制更為復雜。值得注意的是,在DKO ESC中保持甲基化的17個(gè)L1Hs 5’UTR具有較低的CpG密度和GC含量,這可能表明較高的CpG密度有利于TET募集和去甲基化。似乎LINE 5’UTR對DNMT3/TET表達高度敏感并且可以快速切換甲基化狀態(tài),甲基化狀態(tài)對于表達DNMT3的多能細胞中的大多數元件都是有利的。
圖3
5.體細胞增強子被多能細胞中的DNMT3和TET活性靶向
盡管TET可以募集到LINE 5’UTR,但它們更頻繁地定位于啟動(dòng)子或活性增強子,使它們保持低甲基化狀態(tài)。的確,有7%的cDKO-DMR與低甲基化的活性增強子相鄰,支持了先前的證據表明DNMT3s保護了增強子的邊界免受擴展的低甲基化作用(圖3a,d,e)??紤]到TETs在活性增強子中的典型作用,作者認為也可能代表僅在其他細胞狀態(tài)被激活時(shí)才經(jīng)歷去甲基化的調節元件。令人驚訝的是,有85%的cDKO-DMR與至少一種先前定義的組織特異性增強子重疊,并且在相關(guān)的細胞類(lèi)型中被特異去甲基化(圖3a,f,g)。盡管cDKO-DMR幾乎總是體細胞增強子,但事實(shí)并非如此:許多體細胞增強子已經(jīng)在ESC中甲基化,在其相關(guān)組織中保持高度甲基化,或者盡管在其他發(fā)育過(guò)程中失去了甲基化,但在ESC中并未顯示出TET依賴(lài)性去甲基化(圖3h)。為了探索DMR的穩定性,進(jìn)一步傳代了HUES64 DKO克隆A細胞并進(jìn)行了WGBS。在經(jīng)過(guò)28次無(wú)DNMT3活性的傳代后,鑒定到增加了59,618個(gè)DKO-DMR,其中79%與推定的組織特異性增強子重疊。在后期傳代的DKO細胞中,約有三分之一的體細胞增強子仍保持甲基化狀態(tài)。為了檢查增強子去甲基化的能力是否與發(fā)育時(shí)期相關(guān)(它們在發(fā)育過(guò)程中被激活時(shí)),利用最近發(fā)表的數據集,詳細介紹了從HUES64 ESCs到胰島分化的9個(gè)階段中增強子的激活和甲基化動(dòng)力學(xué)。有趣的是,在分化的每個(gè)階段,相似比例的增強子與DKO-DMR重疊,在末端分化的階段,其頻率略高。盡管是推測性的,與ESC分化之間缺乏明顯聯(lián)系表明,一部分胚胎和成年組織特異性增強子可能以依賴(lài)于DNMT3和TET的持續和相反功能的狀態(tài)存在。
6.ESC中體細胞增強子的DNA甲基化缺失影響基因表達
作者想知道如何將TET募集到這組高度甲基化的體細胞增強子中,以及失去主動(dòng)DNMT3募集的影響會(huì )是什么。cDKO-DMR具有高于背景的CpG密度(3.2%),但這尚未分類(lèi),因為大多數具有匹配CpG密度的1-kb區域在DKO細胞中不會(huì )丟失甲基化。當在WT ESC中尋找cDKO-DMR與選定的表觀(guān)遺傳特征之間的關(guān)聯(lián)時(shí),發(fā)現它們通常更富集在開(kāi)放染色質(zhì)和H3K4me1富集區域,而不是H3K27ac富集區域,后者通常與參與轉錄的“活性”增強子相關(guān)(圖3i)。盡管經(jīng)常重疊,但H3K4me1富集仍然不足以預測cDKO-DMR。此外,僅約10%的富含H3K4me1的體細胞增強子也富含H3K27me3,表明不存在經(jīng)典的“平衡”染色質(zhì)狀態(tài)。盡管可以確認這些區域在分化后受到組織特異性轉錄因子的束縛,但并未發(fā)現ESC增強子相關(guān)轉錄因子的富集。然后,將查詢(xún)擴展到其他ESC表達的轉錄因子,包括來(lái)自WT HUES64 ESCs34的8個(gè)ChIP-seq數據集和H1 ESC細胞系ENCODE中63個(gè)ChIP-seq數據集。即使在更大的轉錄因子集上,也未在cDKO-DMR邊界內發(fā)現任何明顯的富集,也未觀(guān)察到任何已知因子的一致序列基序motif。因此,TET的募集可能取決于上述集合中未包括的轉錄因子或替代策略,例如通過(guò)非編碼RNA,或者它可能涉及更復雜的調節機制或相互作用,尚待闡明。
最后,探討了是否可以將DKO-DMR定位于基因并評估潛在的調控作用。平均而言,cDKO-DMR位于距轉錄起始位點(diǎn)48 kb處,并且可以通過(guò)接近6,594個(gè)基因進(jìn)行分配,這不允許進(jìn)行有意義的通路或相互作用分析。相反,進(jìn)行RNA測序(RNA-seq),以識別這些體細胞增強子的甲基化缺失是否影響基因表達。實(shí)際上,晚期傳代DKO細胞與分化相關(guān)的基因顯著(zhù)上調(n=2,455),例如EOMES、SOX17、TGFB2、MSX2、SOX1和SIX1。盡管無(wú)法區分是直接作用還是間接作用,但到第6代,這些基因中已有526個(gè)已經(jīng)顯示出顯著(zhù)的差異表達。在第28代,與差異表達基因相關(guān)的DKO-DMR基本上更接近其基因,另外三分之二的差異表達基因與至少一種DKO-DMR相關(guān)。這些趨勢還支持了靶向調控元件的去甲基化與基因表達上調之間的潛在聯(lián)系。
7. cDKO-DMR是保守的,與多能性有關(guān)
為了探索這種局部調節的動(dòng)態(tài)甲基化的保守性,在小鼠表皮干細胞(EpiSCs)中突變了Dnmt3a和Dnmt3b,因為它們代表了與人類(lèi)多能細胞最接近的發(fā)育和分子類(lèi)似物。在第4步對WT和DKO細胞進(jìn)行了WGBS測序,并鑒定了3888個(gè)與人類(lèi)DKO-DMR具有相似特性的DMR,與82%的推定體細胞增強子重疊。雖然數量、√確序列和坐標未直接在物種之間map,但小鼠DKO-DMR出現在非常相似的位置且與直系同源基因接近(圖4a)。因此,在體細胞增強子處甲基化轉換的機制和這些區域的調控模式都看起來(lái)非常保守。
圖4
由于體細胞也表達DNMT和TET,是否DNMT3/TET在體細胞增強子上的相互作用是多能性所獨有的,還是在分化后仍能保留?研究了發(fā)育各個(gè)階段中缺乏DNMT3活性:這些包括在血清/白血病抑制因子(LIF)中培養的小鼠ESC,它比EpiSC代表更幼稚的多能狀態(tài)。在大多數體細胞不表達具有催化活性的DNMT3B的前提下,還檢查了純合Dnmt3a-/-小鼠的組織,因此DNMT3A的丟失將產(chǎn)生缺乏從頭甲基轉移酶活性的“ DKO樣”細胞(圖4b)。然后,在第4代對WT和DKO ESC以及8天齡WT和Dnmt3a-/-小鼠的腦、結腸、肝和肺組織進(jìn)行了WGBS(圖4b)。與EpiSCs相比,ESC的DKO-DMR多了10倍(n=63,971),而在組織中(大腦,146;結腸,511;肝臟,318;肺,252;)減少了十倍。因此,cDKO-DMR的動(dòng)態(tài)調節似乎僅限于多能細胞狀態(tài),隨著(zhù)發(fā)育的進(jìn)行,TET靶向基因座的數量大大減少。在每種情況下,73-82%的DMR與先前定義的小鼠組織特異性增強子重疊。體細胞Dnmt3a KO DMR優(yōu)先偏愛(ài)位于CpG島和shores附近的1類(lèi)亞組,這表明在這種情況下,TET在很大程度上起到了保護未甲基化區域邊界的作用。
為了補充小鼠數據,重新分析了從HUES64 WT和DNMT3A KO人類(lèi)ESC分化為有絲分裂后運動(dòng)神經(jīng)元的WGBS數據,在該系統中,細胞在第2天失去DNMT3B的蛋白質(zhì)表達,從而在存活的3AKO細胞中產(chǎn)生DKO樣狀態(tài)。細胞在約12天內沒(méi)有DNMT3活性,即便連續不斷地表達TET1-3但是cTKO-DMR仍保持高度甲基化,這進(jìn)一步暗示了參與該過(guò)程的關(guān)鍵因素可能僅以多能狀態(tài)表達。
8.TET酶也在整個(gè)基因組中廣泛地去甲基化
在確定DNMT和TET以多能性特異性方式調節一部分體細胞增強子元件后,在DKO和PKO品系中觀(guān)察到全基因組逐漸去甲基化。為避免將總體測量結果與上述目標DNMT3或TET活性混淆,排除了任何一對樣品之間鑒定出的所有低嚴格DMR(n=238,497)。作為所有體細胞增強子區域。值得注意的是,在存在或不存在TET的情況下,DNMT3的丟失仍然導致每次傳代的總體平均甲基化降低分別為0.0028和0.0037(圖5a)。隨后,估計每個(gè)細胞周期DNA甲基化模式的保真度為99.75和99.64(估計每傳代6天和每傳代4天,DKO和PKO細胞的群體倍增時(shí)間,細胞在培養條件下生長(cháng)時(shí)其數目倍增所需的時(shí)間,分別為28.8h和24h)。
異染色質(zhì)內的甲基化缺失被認為是由于低DNMT1保真度和有絲分裂所致。為了支持該模型,觀(guān)察到了僅表達DNMT1的PKO細胞在異染色質(zhì)區域內甲基化的優(yōu)先缺失。相反,DKO細胞在常染色質(zhì)中表現出優(yōu)先的甲基化缺失,這暗示著(zhù)來(lái)自全基因組TET活性的其他貢獻(圖5b)。低5hmC信號分布在整個(gè)WT ESC的基因組中,包括在惰性的基因間區,其在常染色質(zhì)中的含量較高(圖5b,c)。因此,當沒(méi)有從頭甲基化的DNMT時(shí),甲基化在WT 5hmC高的區域中減少*多(圖5d,e)。
圖5
將WT HUES64 ESC分化為有絲分裂后的運動(dòng)神經(jīng)元,其中5hmC不能通過(guò)分裂被動(dòng)稀釋?zhuān)愿唧w地跟蹤TET的參與度和催化活性。培養60天后,基因(特別是表達的基因)和基因間基因座內富集了5hmC水平,其中*大的增加發(fā)生在惰性染色質(zhì)內,支持了TET的廣泛氧化(圖5f,g)。因此,TET通過(guò)運動(dòng)神經(jīng)元以及ESC的基因組保持了廣泛氧化甲基胞嘧啶的能力。
通常,如果不被DNMT3A或DNMT3B抵消,這種活性將導致胞嘧啶修飾的連續轉換和整體甲基化的降低。在這種范式下,人們可能會(huì )期望ESC在TET丟失后顯示出整體甲基化增加,因為這將使平衡向DNMT3活性轉移。與期望相反,并且如先前在癌細胞中所指出的,與匹配的WT相比,在缺乏TET的細胞中也觀(guān)察到了輕微的下降。與WT相比,這可能與TKO細胞的生長(cháng)速率增加有關(guān),這也可能影響甲基化維持。
為了解DNMT和TET的競爭活性是否有助于甲基化異質(zhì)性,如先前懷疑的富含H3K4me1的增強子區,進(jìn)行了hairpin亞硫酸氫鹽測序,以測量同一分子CpG二聚體上對稱(chēng)的胞嘧啶甲基化。在沒(méi)有從頭DNMT和TET的情況下,發(fā)現了較少的半甲基化二倍體(PKO中為4.48%,WT細胞中為8.89%),這表明DNMT和TET共同作用以在單個(gè)基因座上產(chǎn)生表觀(guān)遺傳變異。(在哺乳動(dòng)物中,DNA甲基化通常以對稱(chēng)的方式出現在CpG核苷酸中,即如果一個(gè)CpG上的一個(gè)胞嘧啶(C)出現甲基化,那么其互補鏈上的相應胞嘧啶(C)也會(huì )被甲基化)。全基因組TET活性的隨機性似乎會(huì )在細胞群體內產(chǎn)生甲基化異質(zhì)性。