1.1?植物組織:CTAB法
1.2?動(dòng)物組織:SDS法
1.3?動(dòng)物血液:Kurabo 試劑盒法
QuickGene DNA whole blood kit S (DB-S),廠(chǎng)家:Kurabo,貨號:40321300101
1.4?粗體核酸純化
試劑盒名稱(chēng):QIAGEN Genomic-tip 20/G,廠(chǎng)家:QIAGEN,貨號:10223
試劑盒名稱(chēng):QIAGEN Genomic-tip 100/G,廠(chǎng)家:QIAGEN,貨號:10243
1.5?微生物樣本
使用TGuide S96磁珠法土壤/糞便基因組DNA提取試劑盒完成核酸的提取
2.1?檢測方法
Nanodrop:賽默飛 Thermo ,型號 NANODROP2000
Qubit:廠(chǎng)家YEASEN, 型號CAT 12642-A ,試劑1XdsDNA HS Assay kit for Qubit
電泳儀:廠(chǎng)家:天能 Tanon ,型號 EPS600
電泳槽:廠(chǎng)家:天根生化科技(北京)有限公司,型號:HE- 120
2.2?判定標準
注:特殊物種實(shí)驗人員會(huì )根據經(jīng)驗進(jìn)行判斷,具體以檢測報告中的判斷結果為準
3.1?建庫流程
3.2?建庫試劑
3.3?建庫設備
4.1?上機操作
4.2?測序試劑
4.3?測序設備
PromethION48 測序儀??廠(chǎng)家?Nanopore???儀器規格?PromethION48
]]>ONT測序技術(shù)在多個(gè)方面具有非常強悍的優(yōu)勢,然而,一份合格的下機數據才是科研成功研究的基礎,為保證得到準確的轉錄組結構分析和定量結果,需要對測序數據進(jìn)行嚴格的質(zhì)控評估。那么我們今天一起學(xué)習一下《Summary statistics and QC tutorial》,ONT官方提供的對測序raw?data進(jìn)行全面數據質(zhì)控的教程。
此教程適用于指導對單個(gè)nanopore測序芯片產(chǎn)出的數據進(jìn)行評估,評估的主要內容如下所示:
1、測序產(chǎn)出(測序得到多少reads,多大數據量);
2、測序數據的質(zhì)量和長(cháng)度分布;
3、如果加入了barcode序列進(jìn)行混樣建庫,測序數據在不同樣品的分布。
直接到教程的github頁(yè)面下載或通過(guò)git命令下載:
git clone https://github.com/nanoporetech/ont_tutorial_basicqc.git QCTutorial
后續分析會(huì )用到下載目錄QCTutorial下的以下內容:
1) Nanopore_SumStatQC_Tutorial.Rmd:Rmarkdown文件,說(shuō)明文檔和用于執行分析。
2) RawData/lambda_sequencing_summary.txt.bz2:示例文件,Guppy對測序reads進(jìn)行堿基識別生成的相關(guān)信息文件。
3) RawData/lambda_barcoding_summary.txt.bz2:示例文件,用于區分混樣建庫時(shí)多樣品的barcode信息。
4) environment.yaml:指定分析所需軟件包及計算環(huán)境的文本文檔。
5) config.yaml:配置文件,用于指定分析所需的輸入。
2、創(chuàng )建Conda環(huán)境
為了方便執行分析所需軟件包及其依賴(lài)的安裝及管理,需要安裝Conda并創(chuàng )建用于此分析的環(huán)境。
1)?Conda安裝(Python3版本的Miniconda):
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
bash
2)?創(chuàng )建Conda環(huán)境及環(huán)境激活(第1步中下載的environmen.yaml用于環(huán)境初始化):
創(chuàng )建環(huán)境:conda env create –name BasicQC –file environment.yaml
激活環(huán)境:source activate BasicQC
進(jìn)行分析之前需先準備配置文件,通過(guò)修改準備步驟下載的config.yaml中相應的參數來(lái)完成,需要修改的內容主要有:
修改內容 | 內容說(shuō)明 | 示例 |
---|---|---|
inputFile | 堿基識別的統計信息 | sequencing_summary.txt.bz2 |
barcodeFile | 混樣建庫的barcode信息 | barcoding_summary.txt.bz2 |
basecaller | 堿基識別工具 | Guppy 2.1.3 |
flowcellId | 測序芯片ID | FAK41706 |
注:如為單樣品測序無(wú)barcode信息,則barcodeFile部分為空。
準備完成后,可以通過(guò)命令行啟動(dòng)分析,命令如下:
R –slave -e ‘rmarkdown::render(“Nanopore_SumStatQC_Tutorial.Rmd”, “html_document”)’
如果習慣圖形界面操作,也可以通過(guò)Rstudio載入Rmarkdown文件執行分析:
上述分析完成后會(huì )將分析結果存放至HTML文件,可用瀏覽器打開(kāi)Nanopore_SumStatQC_Tutorial.html進(jìn)行查看。對單個(gè)芯片約1M reads分析的部分結果展示如下(結果來(lái)自教程,堿基識別使用Guppy 2.1.3,根據識別序列的平均質(zhì)量值將其分為pass和fail兩種,質(zhì)量值閾值默認為7):
1、總結
展示了數據產(chǎn)出的總體情況(如下圖,本分析中堿基識別共產(chǎn)出991,715條序列,14.6G堿基)。
2、質(zhì)量長(cháng)度
此部分展示了對識別出的所有序列質(zhì)量和長(cháng)度信息的統計結果,包括序列的平均長(cháng)度,N50和平均質(zhì)量,序列長(cháng)度和質(zhì)量的密度分布等
3、測序表現
此部分內容統計了隨測序時(shí)間變化,測序累計序列個(gè)數,堿基個(gè)數,測序速度和有效工作納米孔數等指標的變化情況。
4、區分混樣
在加入barcode序列混樣測序的情況下,barcode識別區分的結果展示如下,包括barcode識別效率,區分的文庫個(gè)數及每個(gè)文庫中序列個(gè)數占比和長(cháng)度信息等。
上面展示了分析結果的部分內容,更多細節的內容可參考底部的相關(guān)鏈接。
rawdata的質(zhì)控評估只是整個(gè)信息分析的開(kāi)始,是為了對測序數據有大致的整體認識,以便更好地指導后續分析。然而分析的每個(gè)環(huán)節都會(huì )對最終結果產(chǎn)生影響,因此每一步的處理都要深思熟慮。
2018年8月牛津納米孔公司與百邁客公司達成長(cháng)期合作,擁有MinION、GridION X5和PromethION三種型號全套納米孔測序儀。至今已積累了豐富的項目經(jīng)驗,全長(cháng)轉錄組成功案例先后發(fā)表在《Plant Biotechnol J》、《J Hazard Mater》、《Biotechnol Biofuels》、《Sci Rep》、《Fish & Shellfish Immunology》等國際知名期刊,已發(fā)表文章研究物種分別有楊樹(shù)、吳松草、風(fēng)箏果、甘薯、野生甘薯、兔子、跳甲、花羔紅點(diǎn)鮭和辣椒,覆蓋領(lǐng)域分別為林木、哺乳動(dòng)物、昆蟲(chóng)、水產(chǎn)和作物等。
如您有任何全長(cháng)轉錄組等相關(guān)問(wèn)題,歡迎點(diǎn)擊下方按鈕,我們將竭盡全力為您答疑、設計方案和提供高分成功案例等。
參考鏈接:
https@//github.com/nanoporetech/ont_tutorial_basicqc(@換成:)
https@//community.nanoporetech.com/knowledge/bioinformatics(@換成:)
]]>