被廣泛應用于遺傳基因定位的另一種方法,BSA,也可有效解析質(zhì)量與數量性狀。高通量測序技術(shù)的快速發(fā)展使BSA在基因定位中發(fā)揮著(zhù)巨大潛力,例如,MutMap,SHOREmap與MMAPPR在質(zhì)量性狀定位中可取代傳統的圖位克隆。對于數量性狀,可利用QTL-seq定位QTLs,但定位區間較大很難識別候選基因,所以非常需要一種新的方法,用于快速定位數量性狀候選基因。
介于上述種種定位方法的局限性,本文介紹一種新的方法——QTG-Seq,即通過(guò)QTL分離(即,將數量性狀轉化為質(zhì)量性狀),極端表型混池,高通量測序以及新算法挖掘候選基因。這一方法是由華中農業(yè)大學(xué)李林課題組、章元明課題組與中國農科院王國英課題組開(kāi)發(fā)并應用成功,最后以“QTG-seq accelerates QTL fine mapping through QTL partitioning and whole-genome sequencing on bulked segregant samples”為題,在線(xiàn)發(fā)表在Molecular Plant上。
QTG-Seq基本原理(流程如下)——
(1)群體構建:?F1,?F2,?BC1F1群體
(2)QTL定位:F2群體定位QTL,F2:3家系證明QTL定位結果
(3)QTL分離:分子標記篩選目標QTL雜合,其它QTL純合的BC1F1單株(BC1F1數目要充足);然后自交得到BC1F1:2家系
(4)極端表型選擇:從BC1F1:2中選2個(gè)極端表型組(前20%,后20%,至少1000個(gè)單株)
(5)極端表型混池:提取DNA并混池,形成2個(gè)極端池
(6)測序并變異calling:對兩個(gè)混池測序,與參考基因組比對分析變異
(7)關(guān)聯(lián)分析:新方法smoothLOD(準確關(guān)聯(lián)靶標位點(diǎn)),結合其他方法,如ED(Hill et al., 2013)與G’(Magwene et al., 2011)(關(guān)聯(lián)peak位置)
應用——QTG-Seq快速定位玉米株高QTL,qPH7
以玉米株高為模式性狀展開(kāi)QTG-seq研究:利用4代玉米群體材料,通過(guò)QTL-seq精細定位株高主效QTL,這與傳統QTL精細定位用到許多代創(chuàng )制高世代回交群體明顯不同。首先,利用株高差異明顯的兩個(gè)自交系HZS與1462,構建F2分離群體,個(gè)體株高變化范圍為199cm~307 cm,呈超親分離的現象,暗示株高是由多個(gè)QTLs控制;然后,利用1028個(gè)多態(tài)性標記定位主效QTLs,結果定位到4個(gè)QTL(位于Chr.1,3,6,7),PVE介于7%-17%,又利用F2:3家系驗證QTL定位結果可靠;最后,選擇Chr7.上的QTL?qPH7利用QTL-seq策略進(jìn)行精細定位。
利用12個(gè)標記篩選出813個(gè)BC1F1單株(qPH7位點(diǎn)雜合,另外3個(gè)QTL位點(diǎn)純合),從中選擇15個(gè)材料,自交獲得BC1F1:2家系,并考察株高。共獲得3120個(gè)BC1F1:2單株,從中劃分出2個(gè)極端表型組,低值組580個(gè)單株,高值組567個(gè)單株,并分別組成混池(低池與高池);接著(zhù),對混池展開(kāi)全基因組測序(>280×),檢測到197021個(gè)高質(zhì)量SNPs。利用smoothLOD與ED4算法分析出Chr.7只有一個(gè)峰,并且峰的位置在135.3Mb。KASP標記分型也證實(shí)峰的位置處于135.1與135.2之間。有趣的是,smoothLOD法將qPH7定位在chr:135216475bp,此位點(diǎn)正好處在Zm00001d020874上。Zm00001d020874編碼一個(gè)NF-YC結構域蛋白,它的擬南芥同源蛋白與開(kāi)花時(shí)間有關(guān)。
慮到分離群體中重組blocks的存在,利用增加滑窗大小的方法識別目標區域的重組blocks。由于smoothLOD與G’為連續變量,所以采用ED/SNP的方法分析重組blocks,結果顯示候選基因與peak間距離<150kb。因此,候選基因的區間在300?kb,其中包含13個(gè)基因,也包括基因Zm00001d020874。
因為交換單株數量與定位區間大小密切相關(guān),所以確保較大的混池規模至關(guān)重要。根據模擬數據,QTG-seq相對低的測序深度(<100×)足夠檢測出所有的重組blocks,因為每個(gè)重組block包含許多SNPs,沒(méi)必要對每個(gè)重組block的所有reads測序。因此,為了平衡定位精度與測序成本,在使用QTG-seq方法時(shí),建議增大混池規模與相對低的測序深度。
為進(jìn)一步確定候選基因,本研究又通過(guò)RNA-seq分析發(fā)現,Zm00001d020874表達量在雙親的莖頂端分生組織(SAM)與幼嫩節間組織中存在顯著(zhù)性差異?;跀M南芥同源蛋白功能與smoothLOD定位信號,認為Zm00001d020874是qPH7的候選基因,并且后續的CRISPR基因敲除,蛋白互作驗證等實(shí)驗均暗示Zm00001d020874是控制株高的基因。
Monte Carlo模擬支持QTG-Seq的可靠性
4個(gè)Monte Carlo模擬實(shí)驗如下:
1.?PVE與QTG位置偏差大?。?%時(shí),接近80kb;≥10%時(shí),30-60kb
2.?取樣率與QTG位置偏差大?。寒斎勇蕿?0%時(shí),位置偏差略大;較大的取樣比例會(huì )增加群體大小,但有效重組事件數量也會(huì )增加
3.?群體大小與QTG位置偏差大?。寒斎后w大于4000時(shí),位置偏差小于60kb
4.?測序深度與檢測力:當測序深度大于100×時(shí)(混池超過(guò)1000個(gè)個(gè)體),檢測力達到100%
QTG-Seq特點(diǎn)總結:
1.?省時(shí)省力省錢(qián),不需要構建高世代復雜群體,只需F1,?F2,?BC1F1群體即可實(shí)現;
2.?將多個(gè)QTL分解為單個(gè)QTL分析(數量性狀→質(zhì)量性狀),即,在每個(gè)QTL區域選擇3個(gè)(或多個(gè))多態(tài)性標記篩選目標QTL雜合,其它QTL純合的交換單株,確保交換單株后續自交發(fā)生表型分離以對目標QTL進(jìn)行解析;
3.?測序策略:高的混池個(gè)體數目(數百至上千個(gè)個(gè)體)與相對低的測序深度(~100×);相對低的測序深度,是因為每條重組block上有多個(gè)SNPs,檢測其中1個(gè)SNP就可代表;
4.?關(guān)聯(lián)分析采用新方法smoothLOD,并結合ED與G’,定位精度高,可識別候選基因;smoothLOD可準確關(guān)聯(lián)靶標位點(diǎn),而ED與G’關(guān)聯(lián)peak位置;
5.?可結合KASP標記分型尋找重組斷點(diǎn)等,識別候選基因。
參考文獻:
Zhang H., Wang X., Pan Q., Li P., Liu Y., Lu X., Zhong W., Li M., Han L., Li J., Wang P., Li D., Liu Y., Li Q., Yang F., Zhang Y.-M., Wang G., and Li L. QTG-Seq Accelerates QTL Fine Mapping through QTL Partitioning and Whole-Genome Sequencing of Bulked Segregant Samples.?Mol Plant.?2019 Mar 4;12(3):426-437.
]]>