Hi-C (High-through chromosome conformation capture) 是以整個(gè)細胞核為研究對象,利用高通量測序技術(shù),結合生物信息分析方法,研究全基因組范圍內整個(gè)染色質(zhì)DNA在空間位置上的關(guān)系,獲得高分辨率的染色質(zhì)三維結構信息以及染色質(zhì)調控元件相互作用圖譜。Hi-C可以與RNA-seq、ChIP-seq、ATAC-seq和WGBS(全基因組甲基化測序技術(shù))等數據進(jìn)行聯(lián)合分析,從基因調控網(wǎng)絡(luò )和表觀(guān)遺傳網(wǎng)絡(luò )來(lái)闡述生物體表型形成的相關(guān)機制。而其中ATAC-seq技術(shù)是繼FAIRE-seq、MNase-seq、DNase-seq目前最火熱的研究染色質(zhì)開(kāi)放性的新技術(shù),自2013年后,文章的發(fā)表量逐年攀升。百邁客已做好承接各種組織類(lèi)、細胞類(lèi)樣本的HiC互作和ATAC-seq的準備,成功案例和項目經(jīng)驗還缺您的一把火,年底大促銷(xiāo)等您快快來(lái)咨詢(xún)哦!
英文名稱(chēng):Acute depletion of CTCF rewires genome-wide chromatin accessibility
雜志名稱(chēng):Genome Biol.
影響因子:13.583
發(fā)表日期:2021年8月24日
摘要
CCCTC-結合因子(CTCF)是一種高度保守的含鋅指轉錄因子,被稱(chēng)為“基因組編織大師”。它是研究最廣泛的三維(3D)染色質(zhì)結構調控因子。研究發(fā)現在CTCF急性衰竭細胞模型和其他基因敲除模型中,CTCF在全基因組TAD和TAD內部loop環(huán)的形成中是不可或缺的。為了更好地理解CTCF結合占用率如何促進(jìn)轉錄調控,本文系統地進(jìn)行了多組學(xué)研究,特別關(guān)注染色質(zhì)可及性。通過(guò)系統整合了ATAC-seq、RNA-seq, WGBS, Hi-C, Cut&Run和CRISPR-Cas9基因篩選技術(shù),以及深度蛋白質(zhì)組學(xué)和磷酸化蛋白質(zhì)組學(xué)分析,用以研究CTCF蛋白急性耗竭對細胞的影響。
材料方法
實(shí)驗材料:人B細胞淋巴母細胞白血?。˙-ALL)細胞系SEM(DSMZ),3個(gè)單細胞克隆(clones 27, clones35和clones42)分別用IAA處理24 h和48 h誘導CTCF退化。
ATAC-seq:有無(wú)IAA處理的三個(gè)克隆細胞樣本,一式兩份。
全基因組甲基化測序(WGBS):IAA處理24h或無(wú)IAA處理的clone27。
蛋白質(zhì)組和磷酸化蛋白質(zhì)組分析:CTCFAIDSEM細胞,分為4個(gè)組:no IAA,+IAA 12h,+IAA 23h和+IAA 48h,一式三份。
RNA-seq:有無(wú)IAA處理24h或48h的DSMZ。(前期研究)
Hi-C:有或者無(wú)IAA處理的clone27和clone35。(前期研究)
Cut&Run實(shí)驗:有或者無(wú)IAA處理的clone35和clone42,選用CTCF抗體進(jìn)行富集。(前期研究)
一、急性CTCF耗竭改變了染色質(zhì)的可及性
前期研究已經(jīng)通過(guò)將雙等位基因miniAID-mClover3標簽導入人的內源性CTCF位點(diǎn),并產(chǎn)生了三個(gè)CTCFAID細胞的克隆。在強力霉素和生長(cháng)素(IAA)處理下,強制表達與Skp1/Culin/F-box (SCF)泛素連接酶組分連接的OsTIR1,快速降解CTCF融合蛋白(圖1A)。當強力霉素和IAA完全從培養基中洗脫后,這種降解是可逆的。通過(guò)對三個(gè)單細胞來(lái)源的克隆進(jìn)行IAA處理24小時(shí)的免疫印跡實(shí)驗,證實(shí)了CTCF能夠有效降解(圖1B),類(lèi)似于之前在48h處理條件下的研究結果。
為了研究CTCF耗竭對全基因組染色質(zhì)可及性的影響,對有或無(wú)IAA處理的CTCFAID細胞進(jìn)行了ATAC-seq,同時(shí)野生型SEM細胞和通過(guò)CRISPR敲除兩個(gè)不相關(guān)靶點(diǎn)USF1和USF2的SEM細胞作為對照??偟膩?lái)說(shuō),共發(fā)現了8876個(gè)顯著(zhù)降低的差異可及性區域(DARs), 8042個(gè)可及性顯著(zhù)增加的DARs。熱圖和峰值信號強度結果都證實(shí)了DARs具有高度重現性(圖1C, D)。正如預期的那樣,這些DARs在熱圖中的聚類(lèi)效果顯示出與CTCF耗竭相互一致的趨勢,但在USF1/2敲除的SEM細胞中保持不變,表明這些DARs具有依賴(lài)CTCF的特征。
接下來(lái)分析這些DARs與它們最近的CTCF motif之間的物理距離。結果表明,可及性減弱的DARs更接近于最近的CTCF motifs。相比之下,可及性增強的DARs與CTCF motif的距離顯著(zhù)高于可及性減弱的DARs,但顯著(zhù)低于對照組(圖1E)。
圖1 急性CTCF耗竭會(huì )改變染色質(zhì)的可及性
二、急性CTCF耗竭后染色質(zhì)可及性特征發(fā)生變化
前面綜合分析了在CTCF耗竭后,隨著(zhù)染色質(zhì)可及性的改變,轉錄因子的占用情況。接下來(lái)通過(guò)查看motif數據庫TRANSFAC中所有帶注釋的TF motif,在三類(lèi)區域中計算他們的富集頻率:減弱的DARs、增強的DARs和對照區域。發(fā)現在減弱的DARs中最富集的TFs是CTCF和黏連蛋白(SMC3和RAD21)(圖2A)。Tn5插入位點(diǎn)的foot-printing分析證實(shí),它們的motifs在motif中心受到保護(圖2C)。這些結果表明,減弱的DARs反映了CTCF耗竭產(chǎn)生的影響。
增強的DARs也富集到了CTCF motif,與之前的CTCF-motif距離分析一致(圖1E)。然而,最富集的TF不是CTCF motif。相反,有許多是與活性轉錄相關(guān)的一般轉錄因子(GTFs)(圖2B, D)。這些數據說(shuō)明DARs的調控作用很可能和CTCF的抑制功能相關(guān)。
雖然CTCF和黏連蛋白的motifs在增強和減弱的DARs中都富集到了,但它們在增強的DARs中的foot-printing分析表現出不同的模式特征。與減弱的DARs中Tn5保護的motif中心相比,這些motif周?chē)慕藗纫韰^域更受保護,這與活性啟動(dòng)子和增強子相關(guān)的串聯(lián)CTCF motif(2xCTSes)一致。結果發(fā)現,8042個(gè)區域中有1244個(gè)(15.4%)的DARs與2xCTSes重疊,比對照區域和減弱DARs區域更富集。而這些2xCTSes被認為調節染色質(zhì)loop環(huán),觀(guān)察到的DARs可能與染色質(zhì)loop環(huán)直接相關(guān)。
接下來(lái),將這些loop環(huán)分成三組,并用不同的標準繪制它們的正常染色質(zhì)接觸數。與增強的DARs重疊的loop環(huán)展現出更多的染色質(zhì)內接觸,而與減弱的DARs重疊的loop環(huán)展現出更少的染色質(zhì)內接觸。三組的染色質(zhì)內接觸均在CTCF耗竭后減少。然而,重疊于減弱的DARs的loop環(huán)減少的觸點(diǎn)顯著(zhù)多于重疊于對照NFRs區域和增強的DARs的loop環(huán)(圖2E)??偟膩?lái)說(shuō),loop環(huán)的形成可能只反映CTCF的結合狀態(tài),而不是直接調控染色質(zhì)可及性。然而,較弱的遠端環(huán)似乎更容易失去CTCF。
最后嘗試探索這些DARs是否與TAD邊界有關(guān),發(fā)現對照的ATAC-seq峰和減弱的DARs到TAD邊界的距離分布相似,而增強的DARs總體上出現在遠離TAD邊界的地方(圖2F)。已知TAD邊界在CTCF結合位點(diǎn)和轉錄活性基因(包括管家基因)中富集。CTCF占據的物理位置似乎與其轉錄調控密切相關(guān)。
圖2 急性CTCF耗竭后染色質(zhì)可及性的特征變化
本文假設急性CTCF耗盡的細胞模型最適合于確定全基因組DNA甲基化的即時(shí)反應。
令人驚訝的是,當用WGBS生成DNA甲基化譜時(shí),并沒(méi)有觀(guān)察到急性CTCF耗盡后全基因組DNA甲基化的變化。與ATAC-seq和CTCF Cut&Run的分析結果不同,DARs周?chē)腄NA甲基化水平在對照組和CTCF耗竭組之間沒(méi)有發(fā)現有差異性(圖S9A)。接下來(lái)分析差異甲基化區域(DMRs),發(fā)現只有49個(gè)顯著(zhù)差異區域(圖S9B)。進(jìn)一步檢查這些增強的DMRs富集的motif,并沒(méi)有發(fā)現CTCF或黏連蛋白(圖S9C),表明這些DMRs與CTCF占用沒(méi)有直接關(guān)聯(lián)??傊?,研究結果表明,急性CTCF耗竭不會(huì )影響SEM細胞中全基因組DNA甲基化。
圖S9 急性CTCF耗竭不影響全基因組DNA甲基化
三、依賴(lài)CTCF的染色質(zhì)可及性通過(guò)啟動(dòng)子或增強子-啟動(dòng)子loop環(huán)調節基因表達
雖然CTCF在某些位點(diǎn)的基因調控中不可或缺,如H19-IGF2、β-血紅蛋白、原鈣粘蛋白簇和TP53等,但目前尚不清楚這種轉錄調控是否由CTCF直接作用,或者染色質(zhì)可及性是否也發(fā)揮了作用?;鹕綀D顯示增強的DARs中基因啟動(dòng)子數比減弱的DARs中的更多(圖3A)。接下來(lái)計算DARs中的基因數,發(fā)現這些基因在IAA處理后的細胞的RNA-seq數據中也表現轉錄差異。更多減弱的DARs往往與下調的基因相關(guān),而更多的增強的DARs通常與基因表達增多相關(guān)。
對于表現出一致變化的基因,進(jìn)一步檢查它們啟動(dòng)子的ATAC-seq信號,并確認模式與預期一致(圖3B)。還使用基因表達水平和ATAC-seq信號z-score制作了熱圖,確認了可重復的模式(圖3C)?;谂琶罡叩幕蚣M(jìn)行了基因集富集分析(GSEA),結果表明減弱的DARs與基因下調相關(guān),而增強的DARs與基因上調相關(guān)。因此得出結論,與DARs相關(guān)的轉錄變化特征直接響應CTCF的急性耗竭。
CTCF基因啟動(dòng)子的染色質(zhì)可及性在CTCF耗竭時(shí)也有所增加(圖3D),這一點(diǎn)通過(guò)定量PCR (Q-PCR)進(jìn)一步得到驗證(圖3E)。這些數據表明CTCF可以抑制自身以保持最*表達水平。對于CTCF耗竭后被下調的基因,如MYC,并沒(méi)有在啟動(dòng)子區域檢測到有統計學(xué)意義的染色質(zhì)可及性變化。因此,當啟動(dòng)子區域保持開(kāi)放時(shí),遠端增強子區域的染色質(zhì)景觀(guān)變得更難以接近,再加上CTCF耗竭,可能在控制能調控MYC轉錄的遠端增強子-啟動(dòng)子loop環(huán)的形成中發(fā)揮作用。
圖3?啟動(dòng)子或增強子-啟動(dòng)子環(huán)調節基因表達
四、綜合分析假定的絕緣子CTCF結合位點(diǎn)
本文通過(guò)綜合分析建立了一個(gè)框架來(lái)識別假定的CTCF介導的絕緣子元件。將ATAC-seq結果中的3490個(gè)峰和有CTCF結合的峰取交集,共有716個(gè)增強的ATAC-seq峰。接下來(lái),將它們與RNA-seq結果中上調的基因進(jìn)行比對,判斷TSSs是否位于距離DARs區域2-50 kb的范圍。綜上所述,有67個(gè)基因符合這些標準(圖(Fig 4A)。這67個(gè)基因中有20個(gè)基因的附近有染色質(zhì)loop環(huán)。例如,在BLCAP基因上游約7 kb處觀(guān)察到一個(gè)假定的抑制性CTCF結合峰,該峰位于Hi-C數據所示的染色質(zhì)絕緣loop環(huán)中(圖4B )。在未經(jīng)過(guò)IAA處理的對照CTCFAID細胞中,CTCF與該motif結合導致染色質(zhì)可及性受到抑制,這在A(yíng)TAC-seq數據中信號的缺失很明顯。然而,在急性CTCF耗竭時(shí),ATAC-seq峰值信號和BLCAP mRNA表達明顯增加(圖4C)。
圖 4 綜合分析假定的絕緣子CTCF結合位點(diǎn)
五、CTCF抑制BLCAP表達的功能驗證
為了進(jìn)一步驗證預測的假定絕緣子的作用,將慢病毒表達的引導RNA感染表達Cas9的SEM細胞中,然后進(jìn)行抗生素選擇。Sanger基因組測序(Inference of CRISPR edit, ICE)在目標人群中檢測到約61%的總indel頻率(圖5A),與非靶向導向對照組(sgNT)相比,導致BLCAP mRNA表達顯著(zhù)增加(圖5B)。用IAA處理CTCFAID細胞24和48小時(shí),然后洗脫IAA進(jìn)行CTCF修復。通過(guò)RNA-seq分析和Q-PCR驗證,驗證急性CTCF蛋白耗竭時(shí)BLCAP mRNA的表達(圖5C)。不出所料,生長(cháng)素處理24或48 h后CTCF蛋白急性耗竭,BLCAP表達水平顯著(zhù)升高。更重要的是,洗脫生長(cháng)素后,其表達水平恢復到親本細胞的水平(圖5D)。綜上所述,這些數據有力地支持了CTCF在BLCAP調控區域的占用充當了控制BLCAP表達的功能絕緣體。

圖 5 CTCF在抑制BLCAP表達方面的作用的功能驗證
六、多組學(xué)聯(lián)合揭示CTCF共同調控因子
為了進(jìn)一步研究急性CTCF耗竭對基因表達的影響,本文系統探索了CTCF介導的下游蛋白組和磷酸化蛋白組水平的基因表達,并將其與ATAC-seq和RNA-seq數據聯(lián)合分析(圖6A)??偟膩?lái)說(shuō),將24小時(shí)治療組與無(wú)IAA治療組比較,確定了2550個(gè)差異表達蛋白質(zhì)和1895個(gè)差異表達磷酸肽(圖6B)。雖然觀(guān)察到整體蛋白質(zhì)組和轉錄組之間存在合理的相關(guān)性(圖6C),但只有488個(gè)DE mRNA。與免疫印跡和Q-PCR結果一致,基于質(zhì)譜(MS)的蛋白質(zhì)組學(xué)和RNA-seq分析證實(shí),急性CTCF耗竭后,在蛋白水平上CTCF表達顯著(zhù)減少,在mRNA水平上表達增加。這些數據表明,盡管mRNA水平的變化并不明顯,急性CTCF耗竭誘導了下游響應的大量中斷。
本文開(kāi)發(fā)了一種多組學(xué)聯(lián)合的方法來(lái)定義CTCF共調控轉錄因子,總共鑒定了40個(gè)CTCF共同調控因子,這些TF在急性CTCF耗竭時(shí)在mRNA和/或蛋白質(zhì)水平上顯著(zhù)影響其下游靶基因的表達(圖6D)。正如預期的那樣,這40個(gè)CTCF共調控因子中的大多數也在CTCF介導的DARs中有共同定位,證實(shí)了它們與CTCF有著(zhù)潛在的直接共同調控作用。
此外,我們還研究了CTCF的共調控模式,并選擇了候選的TF包括 ZBTB7A和YY1,同時(shí)DUX作為陰性對照來(lái)觀(guān)測。與對照和增強的DARs相比,這兩個(gè)motif的絕大多數距離減弱的DARs更近,這表明CTCF的耗竭可能會(huì )影響相鄰的開(kāi)放染色質(zhì)可及性,導致與其他TFs結合的缺失(圖6E,F)。而DUX4和CTCF motif距離分布均勻(圖6G)??傊?本文系統地揭示并驗證了CTCF介導和招募的主要共調控因子,通過(guò)編織和改變染色質(zhì)可及性來(lái)實(shí)現下游轉錄調控,并證明了多組學(xué)分析方法是強大的,可以識別不具有明顯表達變化的隱藏主調控因子。
圖6 多組學(xué)分析CTCF調節下游基因表達的主共調控因子
討論
使用急性CTCF退化系統和豐富的可用數據集提供了直接證據,表明CTCF調控染色質(zhì)可及性,但不調控DNA甲基化。CTCF可能在串聯(lián)CTCF結合位點(diǎn)維持染色質(zhì)可及性,從而招募CTCFL到附近的基因并啟動(dòng)轉錄。雖然CTCF的急性耗竭會(huì )深刻地干擾整個(gè)染色質(zhì)相互作用和可及性,但轉錄水平通常不會(huì )有顯著(zhù)改變。這些發(fā)現表明在CTCF急性耗竭后蛋白質(zhì)翻譯和翻譯后修飾過(guò)程中發(fā)生了潛在的全局變化??傊?,CTCF的急性耗竭改變了染色質(zhì)相互作用和可及性,需要進(jìn)一步的研究來(lái)更好地理解CTCF的耗竭如何導致蛋白質(zhì)和翻譯后修飾的巨大變化。
如果您對HiC&ATAC-seq測序技術(shù)感興趣,歡迎點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費為您設計文章思路方案。