三代測序儀以其超長(cháng)讀長(cháng)的優(yōu)勢,在基因組組裝中備受青睞,目前廣泛應用的是PacBio三代單分子熒光測序和Nanopore三代單分子納米孔測序,因Nanopore測序讀長(cháng)更長(cháng)且通量高的特點(diǎn),近幾年在基因組組裝應用中嶄露頭角,先后在Nature Biotechnology上發(fā)表了人的基因組、Plant cell上發(fā)表了野生番茄基因組、Nature Genetics上發(fā)表了高粱基因組等等,測序技術(shù)已相當成熟。
ONT測序結果展示
作物類(lèi)(部分)
林木類(lèi)(部分)
動(dòng)物(部分)
水產(chǎn)(部分)
中藥材(部分)
注:Species:分析的物種信息;SeqNum:各個(gè)長(cháng)度范圍內序列的數目;SumBase:指各個(gè)長(cháng)度范圍內序列的總長(cháng)度;N50Len:reads N50長(cháng)度;N90Len:readsN90長(cháng)度;MeanLen:平均reads長(cháng)度;MaxLen:最長(cháng)reads長(cháng)度;MeanQual:質(zhì)量值。
以上是總結的部分作物類(lèi)、林木類(lèi)、動(dòng)物、水產(chǎn)和中藥材的下機數據結果展示,從以上的數據不難看出,平均raeds長(cháng)度幾乎均在20Kb以上,最長(cháng)reads高達1.6Mb以上(不同樣品DNA抽提難易程度不同,會(huì )造成一定的影響)。
基因組組裝結果展示
上表中最后一列MeanQual就是下機數據的質(zhì)量值,與堿基準確度的換算公式為:準確度 = 1-10^(-Q/10),經(jīng)計算? Nanopore下機數據單堿基的平均準確率約為86%左右,這樣經(jīng)過(guò)校正的數據再用Canu、SMARTdenovo、WTDBG等軟件進(jìn)行基因組的組裝,再經(jīng)過(guò)二代數據的polish之后,堿基的準確度可達到99.99%以上呢!
廢話(huà)少說(shuō),直接上組裝結果!
植物(部分)
動(dòng)物(部分)

注:Species:分析的物種信息;CtgNum:contig數目;CtgLen:contig總長(cháng)度;CtgN50:contigN50長(cháng)度;CtgN90:contigN90長(cháng)度;CtgMax:最長(cháng)contig長(cháng)度;GC(%):GC含量占比。
注:物種:分析的物種信息;Complete BUSCOs:找到完整基因數;Complete and single-copy BUSCOs:其中單拷貝基因數;Complete and duplicated BUSCOs:多拷貝基因數;Fragmented BUSCOs:預測不完整基因數;Missing BUSCOs:沒(méi)有預測出來(lái)的基因數。
評估結果顯示基因完整度均在90%以上??!說(shuō)明Nanopore數據的組裝連續性和完整性都是非常好的,是值得廣大科研工作者信賴(lài)的哦!
百邁客ONT平臺發(fā)展歷程
?
