2019年6月14日,美國羅斯威爾帕克癌癥研究所的劉濤等人在NAR(Nucleic Acids Research,核酸研究)雜志上發(fā)表了針對ATAC-seq開(kāi)發(fā)的分析工具。
ATAC-seq(Assay for Transposase-Accessible Chromatin with highthroughput sequencing),基于高通量測序的染色質(zhì)轉座酶可接近性實(shí)驗。在核小體連接致密的地方,轉座酶不能進(jìn)入,而松散的區域,轉座酶能夠進(jìn)入并切割下暴露的DNA區域,并同時(shí)連接上特異性的接頭,有接頭的DNA片段被分離出來(lái),用于高通量測序。ATAC-seq已被廣泛用于鑒定基因組中可接近的染色質(zhì)區域。 然而,目前的數據分析仍然使用最初為ChIP-seq或DNase-seq設計的方法,而沒(méi)有考慮含有額外核小體定位信息的轉座酶消化的DNA片段。
因此,作者提出了針對ATAC-seq數據的分析工具,HMMRATAC,一種基于半監督機器學(xué)習方法。?HMMRATAC軟件的主要思想是decomposition and integration(分解和集成),首先將單個(gè)ATAC-seq數據集分成無(wú)核小體(nucleosome-free regions, NFR)和核小體富集信號,用隱馬爾科夫模型(HMM)訓練開(kāi)放區域周?chē)毺氐娜旧|(zhì)結構,然后預測整個(gè)基因組中的開(kāi)放區域。?該方法利用了ATAC-seq數據的獨特特征來(lái)識別的染色質(zhì)的結構更準確。
將HMMRATAC軟件應用于已發(fā)布的人類(lèi)ATAC-seq數據集上,發(fā)現其結果優(yōu)于其他流行峰值調用算法。?同時(shí)作者還發(fā)現,相比于未經(jīng)片段大小選擇的配對末端數據,單端測序或片段選擇的ATAC-seq數據集會(huì )導致靈敏度降低。
結束語(yǔ)
偷偷的告訴你,這篇文章的作者也是當年風(fēng)靡一時(shí)現在還如日中天的MACS軟件的作者呦!而MACS2,MACS14都是當前用于CHIP-seq和ATAC-seq中識別Peak區域用的最多的軟件。
參考文獻:
Evan D Tarbell,?Tao Liu.?HMMRATAC: a Hidden Markov ModeleR for ATAC-seq.?Nucleic Acids Research, 2019.
Zhang Y, Liu T, Meyer CA, et al. Model-based analysis of ChIP-Seq (MACS).?Genome Biol. 2008;9(9):R137. doi:10.1186/gb-2008-9-9-r137.
【相關(guān)閱讀】
前沿|ATAC-SEQ專(zhuān)題-GENOME BIOLOGY & GENOME RESEARCH
RNA-SEQ&ATAC-SEQ揭示TRIM28參與HIV-1潛伏感染機制【成功案例】