2019年7月22日,Nanopore平臺全新測序芯片R10到達百邁客實(shí)驗室,百邁客將開(kāi)啟ONT平臺測序新征程!
近年來(lái),由于三代測序相較于二代測序,擁有單分子無(wú)需擴增,長(cháng)度長(cháng)等優(yōu)勢,因此在各組學(xué)研究中大放異彩。而作為三代測序的代表技術(shù)之一,Nanopore平臺因能獲得更長(cháng)讀長(cháng),在基因組學(xué)研究中更是備受青睞。但相較于二代平臺,三代平臺測序數據的準確性一直是比較大的劣勢。本次Oxford Nanopore Technologies公司即將推出的R10芯片,則劍指準確性。相較于當前廣泛使用的R9.4.1芯片,新型R10芯片可提供相當的讀長(cháng),產(chǎn)量及更準確的數據。
R10芯片測序原理
新升級R10芯片大的更新是納米孔采用了雙讀取器(Reader)的設計,能夠對同一堿基進(jìn)行兩次信號識別。理論上,同一堿基的識別次數為R9.4.1版本芯片2倍,由此來(lái)增加堿基的判斷率,減小隨機錯誤,并提高一致準確性。R10與R9.4.1測序方式比較如圖1
圖1??測芯片更新前后測序方式比較
01、單reads測序準確性:
目前主流的R9.4.1芯片的表現能力如何?我們隨機抽取了200個(gè)已經(jīng)完成常規ONT DNA測序的樣品(包含各種動(dòng)植物)進(jìn)行統計,總共約22.4T數據(足夠有代表性了),結果如下:
可以看到,R9.4.1芯片數據的讀長(cháng)是非常理想的:Reads N50高達到72 Kb,平均達到35 Kb;單分子讀長(cháng)高達到了1.6 Mb;而關(guān)于質(zhì)量值平均為8.3,對應準確性為:85.21%;單個(gè)樣品平均質(zhì)量值高達到9.7,對應準確性為:89.28%;
R10的質(zhì)量表現如何呢?我們統計了拿到的四個(gè)樣品的數據,具體統計結果見(jiàn)下圖:
圖2 R10數據質(zhì)量值分布
絕大部分R10 reads的質(zhì)量值達到了10以上(對應準確性為90.0%),而平均質(zhì)量值為12.1(對應準確性為93.8%),而reads質(zhì)量值已經(jīng)達到了15以上(對應準確性為96.84%)。由此可見(jiàn),對于單條reads來(lái)說(shuō),提升還是非常明顯的,平均reads準確性從85%提升到了93.8%。
02、Consensus序列準確:
看完單條reads準確性后,那么組裝時(shí)用到的高深度consensus序列準確性怎么樣呢?官方比較了同一樣本不同芯片測結果的準確性,見(jiàn)圖3。從結果可知,相同測序深度的情況下,consensus后序列的準確性Q值,R10比R9.4.1提升了5~10之間,對應的準確性有的提升了1個(gè)百分點(diǎn)之多。
圖3?不同物種中R10和R9.4.1 reads準確度
從官方的數據顯示,當數據深度為50X時(shí),R10測序數據的consensus序列的準確性已經(jīng)達到了Q44,即99.996%以上(圖4)。且隨著(zhù)測序深度的增加,R10芯片一致準確性逐漸增加。官方對多物種測試發(fā)現,在100X的測序深度下,consensus準確性可以保持在Q45以上,在有些樣本上甚至已達到Q50(99.999%)水平(圖4),當然加大測序深度也可以想要達到更高水平,測試結果中,最高已經(jīng)達到了Q52(99.9994%)。需要注意的是,這都是未經(jīng)過(guò)二代測序數據矯正的結果!
圖4 ?不同測序深度下R10 consensus序列準確性比較
03、同聚物識別準確性:
同聚物的識別準確性是大家一直都比較關(guān)心的問(wèn)題,從ONT官方釋放的測試結果顯示,相比于R9.4.1,R10版本芯片能夠顯著(zhù)提高其在同聚物區域的堿基識別準確度,并且幾乎不會(huì )引入缺失錯誤(圖5)。
圖5 R10、R9.4.1芯片在同聚物區域的測序準確度
04、數據錯誤分布:
官方通過(guò)檢測同一樣本R10和R9.4.1中的錯誤在基因組上的情況,發(fā)現R9.4.1與R10的錯誤在基因組上分布并不是完全重疊的,通過(guò)兩種版本芯片的數據進(jìn)行混合分析,可極大地提高序列的準確性(圖6)。這表明了,在不使用二代數據的前提下,后續也可考慮通過(guò)R10和R9.4.1數據組合的方式來(lái)提高結果的準確度!
圖6?R10和R9.4.1錯誤分布情況
小結
