近日,中國水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所陳四清研究員團隊與北京百邁客生物科技有限公司合作完成了中國真蛸(Octopus sinensis)染色體水平基因組,相關(guān)研究成果發(fā)表在知名期刊Molecular Ecology Resources上。該研究是陳四清研究員團隊繼今年5月發(fā)表超高質(zhì)量綠鰭馬面鲀基因組后在水生生物基礎研究領(lǐng)域取得的又一項重要研究成果。
中文題目:基于PacBio測序和Hi-C技術(shù)的中國真蛸(Octopus sinensis)染色體水平基因組組裝
研究單位:中國水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所
研究背景:頭足類(lèi)是軟體動(dòng)物門(mén)中一類(lèi)高度多樣的海洋物種,分布于世界各地,在海洋生態(tài)系統中扮演著(zhù)重要角色,也是一種重要的漁業(yè)資源。它們進(jìn)化出一些類(lèi)似脊椎動(dòng)物的生物學(xué)結構,表現出復雜的行為特征,生活方式高度活躍,能夠適應多種海洋環(huán)境,是研究趨同進(jìn)化機制和環(huán)境適應性的模式物種。高質(zhì)量的基因組必將有助于頭足類(lèi)生物學(xué)研究,但基因組大和重復序列含量高一直制約著(zhù)頭足類(lèi)基因組學(xué)的發(fā)展。目前,頭足綱僅報道了5個(gè)物種的基因組數據(長(cháng)蛸、加州雙斑蛸、真蛸、中國真蛸和夏威夷短尾魷魚(yú)),本研究是頭足綱中染色體水平的基因組。
研究材料
denovo:成年雌性中國真蛸(Octopus sinensis)腎臟組織
Hi-C:胴部肌肉組織
轉錄組輔助基因預測:11個(gè)樣本(肌肉、心臟、腎臟、肝胰腺、鰓、性腺、大腦、后唾液腺、吸盤(pán)、眼睛和皮膚)
主要結果
使用72.21X Illumina+90.08X PacBio sequel(Reads N50~14 Kb)+77.93X Hi-C進(jìn)行真蛸基因組組裝(表1)。調研圖預估基因組大小為2.76 Gb,雜合度為0.34%,重復性為39.8%(如圖1)。實(shí)際組裝2.72 Gb,Contig N50為503.7kb。二代回比率為98.04%,BUSCO評估結果為80.2%。最終經(jīng)過(guò)Hi-C校正后的基因組大小為2.72 Gb,其contig N50和scaffold N50分別為490 Kb和105.9 Mb,并將96.41%組裝序列掛載至30條染色體上。本次組裝的中國真蛸的基因組是目前已發(fā)表的頭足類(lèi)中染色體水平的基因組,且具有*高的連續性和較高的完整性?(表2),表明PacBio測序技術(shù)可有效地用于大而復雜的基因組的測序和組裝。
圖1?中國真蛸基因組調研圖
圖2 Hi-C熱圖
表1 中國真蛸基因組測序數據
表2 中國真蛸基因組與已發(fā)表的頭足類(lèi)基因組比較
2.?基因注釋
本次研究在真蛸基因組中共注釋出1.15 Gb(42.26%)的重復序列,主要類(lèi)別為L(cháng)INEs (12.38%), LARDs (17.41%)以及 TIRs (16.62%)?;趶念^預測、同源蛋白預測以及RNA-seq的方法預測出31676個(gè)蛋白質(zhì)編碼基因。并通過(guò)NR、TrEMBL、KOG、GO和KEGG數據庫的比對,成功地注釋了26207個(gè)預測基因。根據GenBlastA和GeneWise分析,共鑒定出8213個(gè)假基因,總長(cháng)度為18,187,167 bp,平均長(cháng)度為2,214 bp,并鑒定出5245個(gè)ncRNA,其中1726個(gè)rRNA,2452個(gè)tRNA,32個(gè)miRNA,1028個(gè)snRNA,7個(gè)snoRNA。
3.?基因組進(jìn)化
比較基因組學(xué)分析發(fā)現預測到的31676個(gè)基因中有24698個(gè)基因可被聚類(lèi)到17020個(gè)基因家族。其中有741個(gè)基因家族為10個(gè)物種共有,包含有10653個(gè)同源基因。利用10個(gè)物種的238個(gè)單拷貝同源基因構建進(jìn)化樹(shù),結果表明長(cháng)蛸的分化時(shí)間早于中國真蛸和加州雙斑蛸,而中國真蛸與加州雙斑蛸關(guān)系更近,其分化時(shí)間約為13.88 Mya(圖3)。
圖3 中國真蛸與其它9個(gè)物種種系統進(jìn)化分析
基因家族聚類(lèi)分析表明中國真蛸特有的基因家族有1179個(gè),包含5090個(gè)基因(圖4),這些特有的基因家族可能對中國真蛸的特有性狀具有重要作用?;蚴湛s和擴張分析表明中國真蛸擴張的基因家族有629個(gè),擴張基因家族中的基因主要參與中國真蛸代謝和免疫過(guò)程。其中,C2H2鋅指基因家族和鈣粘蛋白基因家族僅在長(cháng)蛸、加州雙斑蛸和中國真蛸中發(fā)現擴張,而在夏威夷短尾魷魚(yú)和其它物種的基因組中沒(méi)有發(fā)現。
圖4 頭足綱基因家族聚類(lèi)分析
小編有言
高質(zhì)量的染色體水平基因組能夠為后續研究打下堅實(shí)的基礎,而簡(jiǎn)單基因組的快速組裝和基礎分析已是現在物種資源研究的大勢所趨。除了中國真蛸的成功見(jiàn)刊,下面小編將分享給大家幾篇類(lèi)似的百邁客新增成功案例,希望廣大研究者能從中找尋屬于你的研究方向~
Part 1
1
影響因子:6.286
物種:油桐
合作單位:中南林業(yè)科技大學(xué)
主要研究?jì)热荩?/strong>
2020年1月四川大學(xué)劉建全團隊破譯了中國特有的瀕危物種珙桐(Davidia involucrata)基因組,相關(guān)成果發(fā)表在期刊Molecular Ecology Resources上。四川大學(xué)劉建全教授和楊勇志博士為該論文的通訊作者,陳陽(yáng)和馬濤教授為并列一作。該研究利用單分子實(shí)時(shí)測序SMRT和北京百邁客生物技術(shù)有限公司的Hi-C技術(shù)組裝了一個(gè)高質(zhì)量、染色體體水平的珙桐基因組,研究發(fā)現苞片中光合作用相關(guān)基因幾乎缺失或表達減少,而抗菌、抗冷、抗水等抗逆相關(guān)基因在苞片中高度表達,突出了苞片在保護花和吸引授粉者中的重要作用。有效群體大小等研究分析了珙桐的生存機制和瀕危原因。在未來(lái)氣候持續變暖的背景下,研究結果為保護這獨特的瀕危物種提供了依據。
2
影響因子:6.286
物種:綠鰭馬面鲀
合作單位:中國水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所
主要研究?jì)热荩?/strong>
2020年5月,中國水產(chǎn)科學(xué)研究院黃海水產(chǎn)研究所陳四清研究員團隊與北京百邁客生物科技有限公司合作完成了超高質(zhì)量的綠鰭馬面鲀基因組,相關(guān)研究成果發(fā)表在知名期刊Molecular Ecology Resources上。本次研究基于納米孔測序技術(shù)(Nanopore)和染色體構象捕獲技術(shù)(Hi-C)完成的基因組僅包含242個(gè)Contigs,Contig N50高達22.46 Mb,并將99.44%序列掛載到20條染色體上,實(shí)現了海洋魚(yú)類(lèi)基因組組裝質(zhì)量質(zhì)的飛躍。
Part 2
1
影響因子:5.404
物種:簸箕柳
合作單位:南京林業(yè)大學(xué)
主要研究?jì)热荩?/strong>
2020年2月南京林業(yè)大學(xué)尹佟明教授課題組成功破譯柳樹(shù)基因組,相關(guān)研究成果發(fā)表在Horticulture Research上。該研究利用百邁客生物科技有限公司的PacBio測序和Hi-C技術(shù),獲得了一個(gè)高質(zhì)量染色體版本的簸箕柳參考基因組。新組裝的簸箕柳基因組大小為356 Mb,Contig N50為263,908bp,并通過(guò)Hi-C,將95.29%的簸箕柳基因組序列掛載到19條染色體上。新組裝的簸箕柳為木本植物研究提供了高質(zhì)量的基因組資源。
2
影響因子:5.404
物種:油柿
合作單位:浙江大學(xué)、亞林所
主要研究?jì)热荩?/strong>
2019年12月Horticulture Research在線(xiàn)發(fā)表了由浙江大學(xué)、中國林業(yè)科學(xué)研究院亞熱帶林業(yè)研究所等單位合作完成的二倍體油柿(2n=2x=30)基因組研究論文。研究中使用百邁客生物科技有限公司的PacBio測序組裝了849.53 Mb油柿基因組序列,進(jìn)一步通過(guò)Hi-C技術(shù)將其中799.71 Mb(占全基因組序列的94.14%)的序列定位到15條染色體上,并通過(guò)slaf簡(jiǎn)化測序獲得的遺傳圖譜分析研究了其進(jìn)化關(guān)系。
3
影響因子:5.404
物種:板藍根(菘藍)
合作單位:四川大學(xué)
主要研究?jì)热荩?/strong>
2020年2 月1日,四川大學(xué)生命科學(xué)學(xué)院劉建全課題組與華中農業(yè)大學(xué)作物遺傳改良國家重點(diǎn)實(shí)驗室李再云課題組首次完成了菘藍(Isatis indigotica,2n=14)染色體級別基因組圖譜繪制。該研究利用Pacbio測序(140X)結合北京百邁客生物技術(shù)有限公司的Hi-C技術(shù)(284X)組裝得到294Mb高質(zhì)量基因組(contigN50=1.2Mb)?;谕此阉骱凸δ茏⑨?zhuān)_定了該物種主要化合物(如吲哚類(lèi)、萜類(lèi)、黃酮、木脂素等物質(zhì))的可能生物合成通路和相關(guān)的候選基因。該研究強調了基因組測序在鑒定藥用植物代謝產(chǎn)物合成候選基因中的重要性,為今后十字花科植物比較基因組等研究提供了重要遺傳信息。
Part 3

2020年2月6日,上海市農業(yè)科學(xué)院張學(xué)英研究員團隊于知名期刊Gigascience上首次發(fā)表枇杷基因組相關(guān)研究論文,該研究中基于北京百邁客生物科技有限公司的Nanopore測序和Hi-C染色體構象捕獲技術(shù),構建了高質(zhì)量的枇杷基因組。文中通過(guò)與蘋(píng)果、水蜜桃、梨、覆盆莓、月季和野草莓的蛋白質(zhì)序列比較,探索了枇杷的全基因組復制與進(jìn)化事件,并進(jìn)行了染色體重排分析。該研究提供了寶貴的染色體水平基因組數據,為研究枇杷性狀提供了重要的基因組數據。
百邁客基因組成功案例
選擇百邁客的理由:
百邁客擁有專(zhuān)業(yè)的分析/合作團隊(國際期刊Nanture Genetics合作文章高達6篇,截至2020年7月共產(chǎn)出50余篇基因組文章,IF 500+)?;蚪M及HI-C項目經(jīng)驗豐富,構建逾千個(gè)文庫,HiC技術(shù)實(shí)驗+生信雙保護。分析物種類(lèi)型多樣,高雜合高重復、多倍體物種研究經(jīng)驗豐富(2倍體、3倍體、4倍體、6倍體、8倍體、10倍體等),疑難雜癥不在話(huà)下!