2024年11月14日,北京大學(xué)現代農業(yè)研究院郭立研究員團隊的本氏煙草完整基因組研究成果以“The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres”為題,在國際著(zhù)名期刊Nature Plants上在線(xiàn)發(fā)表。
文章通過(guò)構建本氏煙草端粒到端粒無(wú)缺口基因組,對本氏煙草進(jìn)行了亞基因組分型,進(jìn)一步確定林煙草(N. sylvestris)和漸狹葉煙草(N. attenuata)最可能是其二倍體祖先物種。研究還深入解析了異源四倍體本氏煙草的著(zhù)絲粒序列及其表觀(guān)特征,豐富了我們對本氏煙草基因組進(jìn)化和著(zhù)絲粒演化過(guò)程的認識。
文章標題:The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres
合作單位:北京大學(xué)現代農業(yè)研究院
發(fā)表期刊:Nature Plants
研究對象:本氏煙草
百邁客生物為該研究提供了PacBio HiFi、Hi-C、Illumina和RNA-seq測序服務(wù)。
研究背景
本氏煙草(Nicotiana benthamiana)是一年生茄科煙草屬植物,原產(chǎn)于澳大利亞北部地區,和用于制作香煙的普通煙草(N. tabaccum)是近緣物種。本氏煙草最為人知的是作為植物學(xué)和合成生物學(xué)研究的模式植物。本氏煙草憑借其對病毒的易感性和在瞬時(shí)基因表達的便利性成為了植物科學(xué)家的“寵兒”,同時(shí)它也是植物天然產(chǎn)物和疫苗異源合成的重要底盤(pán)生物。因此,解析本氏煙草的基因組密碼對促進(jìn)植物科學(xué)研究和生物制藥產(chǎn)業(yè)具有重要的價(jià)值。本氏煙草是異源四倍體,由兩個(gè)二倍體祖先在距今500萬(wàn)年-600萬(wàn)年雜交形成,之后基因組演化形成現今的19對染色體。本氏煙草基因組約為2.85Gb,其草圖最早發(fā)表于2012年,之后的12年間多個(gè)改進(jìn)版本的本氏煙草基因組陸續公布,組裝質(zhì)量有了很大提升,但仍然存在多個(gè)缺口與組裝注釋錯誤,嚴重影響了對這一模式生物的功能基因組學(xué)的研究進(jìn)程。
著(zhù)絲粒是負責細胞分裂過(guò)程中染色體平均分配給子細胞的基因組關(guān)鍵區域,也被稱(chēng)為基因組的暗物質(zhì)區域。因其高度復雜并富含重復序列,著(zhù)絲粒的序列很難被測序和破譯。近年來(lái)隨著(zhù)測序技術(shù)和生物信息算法的快速發(fā)展,包括人類(lèi)、擬南芥、酵母在內的多個(gè)模式生物以及玉米、水稻、辣椒、生菜等作物的著(zhù)絲粒特征逐漸被揭示。這豐富了我們對這些基因組暗物質(zhì)的認知,為疾病研究和治療、作物單倍體育種、人工染色體合成等前沿科學(xué)提供理論指導。然而,我們對生物界著(zhù)絲粒的結構和進(jìn)化理解仍然處在初期,絕大多數生物的著(zhù)絲粒區域仍未解析。此外,多倍體生物例如四倍體本氏煙草、四倍體馬鈴薯、六倍體小麥等,基因組經(jīng)歷了復制、重排和結構變異等事件,在此過(guò)程中著(zhù)絲粒如何演化和維持功能也有待闡明。異源四倍體的本氏煙草為這些問(wèn)題的解答提供了一個(gè)理想的模型。
研究結果
研究團隊首先采用單分子測序技術(shù)(HiFi,116.7x?+ ONT ultra-long,47.9x),Hi-C(150x)和Bionano(329.6x)光學(xué)圖譜等多種技術(shù)相結合策略,構建了T2T無(wú)缺口的本氏煙草基因組(2.85 Gb),實(shí)現所有染色體的完整分型組裝(圖1),并鑒定到所有19個(gè)著(zhù)絲粒和38個(gè)端粒,contig N50值達到146.4 Mb。隨后的質(zhì)量評估表明該基因組具有很高的堿基準確性和組裝完整性。

圖1-本氏煙草T2T基因組全局特征、多倍體進(jìn)化歷史和著(zhù)絲粒演化進(jìn)程
研究團隊還進(jìn)一步基于著(zhù)絲粒特異結合蛋白CENH3的ChIP-seq數據,確定了本氏煙草基因組的完整著(zhù)絲粒序列,并揭示了其著(zhù)絲粒全景特征。令人驚訝的是,與辣椒和馬鈴薯等茄科作物的著(zhù)絲粒(以L(fǎng)TR/Gypsy反轉錄轉座子為主)不同,本氏煙草著(zhù)絲粒不僅有Gypsy序列,而且存在大量的衛星(Satellite)DNA的重復陣列,暗示這些著(zhù)絲粒特異的衛星重復序列是在本氏煙草中新出現的(圖2)。經(jīng)過(guò)仔細分析,研究團隊證明了本氏煙草著(zhù)絲粒衛星陣列可能起源于核糖體DNA的基因間間隔序列。
此外,在著(zhù)絲粒組蛋白CENH3優(yōu)先占據的區域,Gypsy反轉錄轉座子和核基因組線(xiàn)粒體插入序列(NUMT)廣泛侵入本氏煙草著(zhù)絲粒,表明這些DNA元件在著(zhù)絲粒功能中起著(zhù)至關(guān)重要的作用。有趣的是,NUMT在本氏煙草著(zhù)絲粒中的插入具有很強的亞基因組偏好性,并且主要與母體著(zhù)絲粒周?chē)嘘P(guān)。亞基因組分析表明,衛星陣列的出現可能推動(dòng)了多倍體后著(zhù)絲粒的形成(圖2)。
最后,該研究提出一個(gè)模型來(lái)解釋本氏煙草著(zhù)絲粒的進(jìn)化,即本氏煙草基因組在多倍化后通過(guò)新著(zhù)絲粒形成、衛星序列擴展、反轉錄轉座子的富集和NUMT整合而實(shí)現著(zhù)絲粒進(jìn)化(圖1),豐富了我們對于茄科植物和多倍體植物著(zhù)絲粒演化的認知。

圖2-本氏煙草著(zhù)絲粒衛星重復序列推動(dòng)新著(zhù)絲粒的形成和進(jìn)化
研究總結
該研究公布了模式植物本氏煙草的T2T無(wú)缺口基因組,并揭示了其著(zhù)絲粒的全景結構及其表觀(guān)遺傳特征,該研究成果具有里程碑意義。本氏煙草完整基因組的破譯不但為植物科學(xué)研究提供了重要的遺傳資源,也將促進(jìn)本氏煙草作為模式和底盤(pán)植物在生物技術(shù)領(lǐng)域的廣泛應用。
內容來(lái)源于北京大學(xué)現代農業(yè)研究院,侵刪