作為國內第三代測序領(lǐng)域的領(lǐng)航者,百邁客遵循ISO 15189國際質(zhì)量體系要求建成了分子遺傳實(shí)驗室,并率先引進(jìn)了PacBio RSII和PacBio Sequel第三代測序儀。截至2017年8月,百邁客已經(jīng)完成了多個(gè)物種的全長(cháng)轉錄組測序,主要包括花卉、作物、蔬果、水產(chǎn)等?;诙嗄甑捻椖糠e累,我們擁有豐富的樣本處理與數據分析的經(jīng)驗,助力文章的快速發(fā)表。今天和大家分享一篇公司的三代項目文章。
研究背景
甘薯是許多發(fā)展中國家重要的作物之一,也是重要的能量來(lái)源。甘薯是同源六倍體植物,基因組大小約3-4G,目前還沒(méi)有高質(zhì)量的參考基因組。甘薯采用異花授粉的繁殖方式,自交不孕,導致基因組的雜合度高,目前還沒(méi)有關(guān)于甘薯正向遺傳學(xué)研究的報道。幾乎所有關(guān)于甘薯轉錄本的研究都是采用轉錄組測序的方法,沒(méi)有獲得大規模的全長(cháng)cDNA序列,因此阻礙了甘薯功能基因組學(xué)和分子育種研究的進(jìn)展。長(cháng)期以來(lái),人們一直認為甘薯有可能由二倍體祖先野生甘薯(I. trifida)進(jìn)化而來(lái),但是沒(méi)有確鑿的證據。
研究目的
通過(guò)2+3聯(lián)合測序的方法獲得甘薯和野生甘薯的全長(cháng)轉錄本,揭示二者的進(jìn)化關(guān)系。
材料方法
實(shí)驗材料
甘薯和野生甘薯,不同組織(幼葉、成熟葉、莖尖、莖稈、須根、起始塊根、膨大塊根和成熟塊根)分別等重量混合,提取RNA用于三代測序;同樣的材料用于二代測序。
測序方法及數據量
百邁客Pacbio RSII:構建1-2k、2-3k、>3k的3個(gè)文庫,每個(gè)文庫分別測1個(gè)、2個(gè)、1個(gè)cell,共8個(gè)cell。
百邁客Illumina HiSeq 2500:甘薯和野生甘薯各測了17G和11G數據。
技術(shù)路線(xiàn)
研究結果
5.1 全長(cháng)轉錄本的統計及結構注釋分析
統計三代的數據發(fā)現:甘薯得到220,035 個(gè)ROI(reads of insert),其中全長(cháng)非嵌合轉錄本(Full-Length Non-Chimeric, FLNC)占49.9%,非全長(cháng)轉錄本(Non-Full-Length, NFL)占46.6%;野生甘薯得到195,188 個(gè)ROI,其中FLNC 和NFL 分別占52.1%和43.9%。對三代的數據進(jìn)行矯正(自我糾錯+二代數據矯正),甘薯和野生甘薯分別獲得了53,861和51,184個(gè)非冗余轉錄本。此外,甘薯和野生甘薯分別預測到了104,540 和94,174 個(gè)ORF,全長(cháng)轉錄本(同時(shí)含有5’-UTR,CDS和3’-UTR)分別有34,963和33,637個(gè)。甘薯和野生甘薯分別鑒定到了 25,315和 27,090 個(gè)SSR,以及471 和531 個(gè)lncRNA。
Figure 1. 對三代測序的數據進(jìn)行分類(lèi)統計和結構注釋
5.2 甘薯、野生甘薯與其它植物的CDS比較分析
為了評估甘薯、野生甘薯的轉錄本和其他植物基因的相似性,我們比較了甘薯、野生甘薯與其他植物的開(kāi)源CDS數據庫,包括紅苔藤、野生甘薯、牽?;?、煙草、馬鈴薯、大豆、擬南芥和水稻。結果表明甘薯和野生甘薯大多數的轉錄本都是同源的,說(shuō)明這兩個(gè)物種擁有一個(gè)大致相同的基因庫。觀(guān)察高比例的轉錄本發(fā)現,盡管這些物種中的大量基因在進(jìn)化過(guò)程中存在著(zhù)巨大的差異,但仍然共有一些短的motif,說(shuō)明這些基因在進(jìn)化上顯示出高度的保守性。
Figure 2. 比較甘薯、野生甘薯和其他植物的轉錄本
5.3 全長(cháng)轉錄本的結構分析
三代測序得到的全長(cháng)cDNA對于研究基因的結構非常有用,例如分析外顯子-內含子的結構。我們隨機挑選了50個(gè)基因進(jìn)行比較,發(fā)現這些基因含有的外顯子數目在甘薯、野生甘薯和擬南芥三個(gè)植物中的分布是相似的。
Figure 3. 分析甘薯、野生甘薯和擬南芥的外顯子-內含子結構
5.4 甘薯和野生型甘薯的Ka/Ks分析
人們普遍認為二倍體野生甘薯是六倍體作物甘薯的祖先,為了尋找參與甘薯進(jìn)化的候選基因,我們研究了甘薯和野生甘薯的基因選擇模式。首先比較了二者的完整轉錄本數據集,去除有多種同源性可能的那些轉錄本,確定了1269個(gè)假定的甘薯和野生甘薯之間的同源基因對。隨后,計算了每個(gè)基因對的Ka/Ks比值,大多數基因對的Ka/Ks比值都小于1,只有56個(gè)基因對的Ka/Ks比值大于1,表明在甘薯的進(jìn)化或馴化過(guò)程中,大多數基因都是受到純化選擇的。而受到正向選擇的這些基因將作為后續研究的重點(diǎn)。
Figure 4. 分析甘薯和野生甘薯同源基因對的Ka/Ks比值
創(chuàng )新點(diǎn)
1,對于無(wú)參或者參考基因組不好的物種,全長(cháng)轉錄組可以獲得轉錄本全長(cháng)序列,完善基因組注釋的信息。
2,通過(guò)全長(cháng)比較轉錄組分析研究近源物種間的進(jìn)化關(guān)系。
參考文獻:
Generation and comparative analysis of full-length transcriptomes in sweetpotato and its putative wild ancestor I. trifida(bioRxiv在線(xiàn)發(fā)表,2017)