2019年04月18日,Genome Biology在線(xiàn)發(fā)表了中國科學(xué)院昆明動(dòng)物研究所與北京百邁客生物科技有限公司共同合作文章“Whole genomes and transcriptomes reveal adaptation and domestication of pistachio” 中國科學(xué)院昆明動(dòng)物研究所研究員吳東東為本文通訊作者,中國科學(xué)院昆明動(dòng)物研究所曾琳,北京百邁客公司大項目負責人韓鳳鳴,戴鶴為共同第一作者。本文繪制了開(kāi)心果的基因組草圖,并對其進(jìn)行了大規模的基因組重測序并進(jìn)行了比較基因組分析,表明,開(kāi)心果的應激適應可能與細胞色素P450和幾丁質(zhì)酶基因家族的擴增有關(guān)。尤其重要的是,比較轉錄組學(xué)分析表明茉莉酸(JA)生物合成途徑在開(kāi)心果耐鹽性中起著(zhù)重要作用。此外,研究人員對93個(gè)栽培種和14個(gè)野生種(P. vera)基因組及35個(gè)親緣關(guān)系密切的野生黃連木屬基因組進(jìn)行了重測序,以提供對種群結構、遺傳多樣性和馴化的見(jiàn)解與思路。

研究背景
隨著(zhù)農業(yè)面積的減少和人口的增長(cháng),糧食危機正成為一個(gè)日益嚴重的問(wèn)題。沙漠約占地球陸地表面積的三分之一,是貧瘠的環(huán)境,幾乎沒(méi)有降水,通常有干燥和堿性土壤,因此對大多數植物和動(dòng)物的生活條件都很不利。然而,一些沙漠地區仍可以種植一些作物。洞察這些物種的環(huán)境適應和經(jīng)濟特征,有助于在不同的沙漠地區種植和繁殖這些作物,這可能有助于緩解世界糧食危機。
開(kāi)心果(p.vera,2n=30,圖1a)雙子葉植物綱、無(wú)患子目和漆樹(shù)科,是起源于中亞和中東的腰果家族成員。它是一種沙漠植物,對鹽漬土有很高的耐性。開(kāi)心果最近成為第五大堅果作物,除了具有經(jīng)濟、營(yíng)養和藥用價(jià)值外,對非生物脅迫也有很強的適應能力,被認為是一種能耐受干旱和鹽堿脅迫的物種,是干旱和鹽堿區重新造林的理想選擇。
盡管基因組測序的快速發(fā)展有助于發(fā)現許多作物馴化和改良的遺傳基礎,但關(guān)于開(kāi)心果的研究卻很少。據估計,開(kāi)心果的基因組大小約為600 MB,雜合率高。Moazzzam Jazi等人利用全基因組轉錄組,通過(guò)對照和鹽處理兩個(gè)開(kāi)心果品種的比較,發(fā)現了耐鹽性相關(guān)的標記物和應激反應機制。
在本研究中,為了更好地了解開(kāi)心果馴化的分子進(jìn)化歷史,研究人員組裝了開(kāi)心果的基因組草圖,并對107個(gè)全基因組進(jìn)行了重測序,包括93個(gè)馴化和14個(gè)野生的開(kāi)心果以及35個(gè)不同野生黃連木屬物種。整合基因組和轉錄組學(xué)分析顯示,擴張的基因家族(如細胞色素P450和幾丁質(zhì)酶)和茉莉酸(JA)生物合成途徑可能參與應激適應。比較群體基因組分析顯示,開(kāi)心果大約在8000年前被馴化,馴化的關(guān)鍵基因可能是那些涉及樹(shù)木和種子大小的基因,這些基因經(jīng)歷了人工選擇。這些基因組序列應該有助于未來(lái)的研究,以了解沙漠作物的農業(yè)和環(huán)境相關(guān)特性的遺傳基礎。
材料方法
開(kāi)心果(P.vera)二代測序denovo:
測序材料:開(kāi)心果栽培種“Batoury”;Illumina Hiseq 2500[包括兩種類(lèi)型小片段文庫(270 bp和500 bp)]和六種類(lèi)型 mate-pair文庫(3 kb、4 kb、8 kb、10 kb、15 kb和17 kb);PacBio sequel
重測序:107個(gè)開(kāi)心果(93個(gè)馴化+14個(gè)野生)、35個(gè)不同野生黃連木屬物種;Illumina;
轉錄組:A:鹽處理:Ohadi(根:salt treatment 3 rep vs control 3 rep;葉:salt treatment 3 rep vs control 3 rep);B:野生型和馴化型:Ohadi和Sarakhs[根:Sarakhs (wild 3 rep) vs Ohadi (control 3 rep);葉:Sarakhs (wild 3 rep) vs Ohadi (control 3 rep)];
注:Ohadi與Sarakhs分別代表Pistacia vera的不同品系,Ohadi被認為是馴化型,Sarakhs是野生型)。
研究結果
1.?開(kāi)心果的基因組進(jìn)化
利用Illumina Hiseq 2500平臺組裝了569.12 Mb的開(kāi)心果基因組草圖,Contig N50為20.69kb和Scaffold N50為768.39 Kb。為了提高連續性,進(jìn)一步通過(guò)PacBio sequel系統組裝了671 MB的基因組草圖,ContigN50為75.7 Kb,Scaffold N50為949.2 Kb?;蚪M質(zhì)量與先前報道的植物基因組相一致,有助于一些令人信服的數據分析。裝配尺寸略大于估計的基因組尺寸,這可能是與開(kāi)心果的高雜合度(1.72%)有關(guān)。轉座因子占開(kāi)心果基因組的70.7%,其中46.75%為L(cháng)TR(長(cháng)末端重復轉座)。CEGMA分析表明,96.94%的核心蛋白編碼基因被恢復。BUSCO評估表明有94.51%完整的基因模型。
作者首先進(jìn)行了比較基因組研究,以評估該物種的古歷史。利用9個(gè)植物基因組單拷貝家族基因的系統基因組分析表明,開(kāi)心果在58百萬(wàn)年前從柑橘中分離并在105百萬(wàn)年前從毛果楊中分離出來(lái)。4DTV結果表明,開(kāi)心果基因組在其與這些物種的分化之后沒(méi)有經(jīng)歷譜系特異性的全基因組復制。文中還通過(guò)將開(kāi)心果基因組與基礎被子植物無(wú)油樟基因組進(jìn)行共線(xiàn)性分析,表明每個(gè)無(wú)油樟區域最多有三個(gè)開(kāi)心果區域,而每個(gè)開(kāi)心果區域最多有兩個(gè)毛果楊區域(圖1b)。共線(xiàn)性分析支持這樣一個(gè)結論:開(kāi)心果中沒(méi)有發(fā)生譜系特異性基因組復制,但它們與真雙子葉植物中發(fā)生的γ復制相同,而毛果楊經(jīng)歷了譜系特異性基因組復制事件。

圖1 開(kāi)心果基因組進(jìn)化
2.?開(kāi)心果應激適應相關(guān)的擴張基因家族
為了揭示開(kāi)心果表型(如耐鹽性)的遺傳基礎,利用OrthoMCL通過(guò)識別不同植物之間獨特和共同的基因家族來(lái)研究基因家族的進(jìn)化。開(kāi)心果與擬南芥、柑橘、雷蒙德氏棉、葡萄相比有9735個(gè)共有基因家族,而含有1381個(gè)基因的707個(gè)開(kāi)心果有特基因家族。對這些基因進(jìn)行GO與KEGG富集分析,并都發(fā)現了許多與“防御反應”有關(guān)的基因,其中包括許多包含NB-ARC domain和NBS-LRR domain的基因。這種基因以植物抗病性著(zhù)稱(chēng),對開(kāi)心果的防御反應具有相當重要的意義。
接下來(lái),作者研究了開(kāi)心果基因家族的擴張和收縮(圖1c)。由于很難從基因家族規模的收縮或與未在該參考基因組中成功組裝的基因有關(guān),這里只分析了擴展的基因家族。對擴展基因家族的基因富集分析發(fā)現,它們在代謝類(lèi)別中豐富,如萜類(lèi)、黃酮類(lèi)、倍半萜類(lèi)和生物堿的生物合成?;蚣易宓臄U展發(fā)生在長(cháng)期進(jìn)化之后,并推動(dòng)了黃連木屬和柑橘屬之間的進(jìn)化差異,而不是開(kāi)心果從野外馴化的非常短期的進(jìn)化。因此,我們認為上述基因的擴展可能與野生黃連木中有機化合物的代謝有關(guān)。野生黃連木的植物化學(xué)篩選發(fā)現了許多植物化學(xué)物質(zhì),如生物堿、黃酮、香豆素、甾醇、單寧、萜類(lèi)和倍半萜類(lèi)。
此外,豐富的術(shù)語(yǔ)“氧化還原過(guò)程”包含許多細胞色素P450基因,這些基因編碼參與多種功能復雜代謝途徑的蛋白質(zhì),并在多個(gè)過(guò)程中發(fā)揮重要作用,特別是在應激反應中發(fā)揮作用。在187個(gè)細胞色素P450基因中,我們發(fā)現許多可能具有耐鹽功能。例如,透水性研究發(fā)現,CYP94家族基因表達水平的升高可減輕水稻的茉莉酸反應,增強水稻的耐鹽性。在開(kāi)心果的這些擴張基因家族中,有14個(gè)CYP94基因。大豆中,CYP82A3參與茉莉酸和乙烯信號通路,增強對鹽堿和干旱的抗性,開(kāi)心果擴張基因家族中有20個(gè)CYP82基因成員。毛果楊CYP714A3的異位表達增強了水稻的耐鹽性,開(kāi)心果擴張基因家族中有10個(gè)CYP714A基因。因此,一些細胞色素P450基因可能與開(kāi)心果的耐鹽性有關(guān)。
3.?RNA-seq揭示了開(kāi)心果鹽適應的遺傳機制
進(jìn)一步研究開(kāi)心果的耐鹽性潛在遺傳機制,研究者進(jìn)行了鹽度實(shí)驗。開(kāi)心果砧木(P.vera?L.cv.Ohadi)的葉和根在正常條件和鹽度條件下進(jìn)行RNA測序。使用Tophat-Cufflinks-Cuffdiff?pipeline,在鹽水條件下處理的植物與對照之間表現出差異表達,鑒定214和461蛋白質(zhì)編碼基因分別在葉和根組織中(ncontrol = 3, nsalinity = 3, corrected P < 0.05,)?;蚋患治霭l(fā)現許多差異表達基因(31個(gè)基因)參與到“氧化還原進(jìn)程”中(圖2a,b)。像比較基因組分析一樣,該類(lèi)別中的15個(gè)基因是細胞色素P450基因,特別是CYP74A(即AOS),其編碼細胞色素P450 CYP74基因家族的一個(gè)成員,其起到丙二烯氧化物合酶(AOS)的作用。這種酶催化茉莉酸酯合成中的第一步[即茉莉酸(JA)]。AOS中每千堿基外顯子的表達片段(FPKM)值在葉片中從對照中的近0增加到鹽水條件下的2163.75,在根中從對照中的1.87增加到鹽水處理的87.74。研究者還發(fā)現了7個(gè)差異表達的基因(ChiC, TT4, ILL6, MYB108, MYB6, PRB1, and TIFY5A)被富集到“茉莉酸反應”中。以前的研究表明,干旱和高鹽度導致水稻葉片和根部JA含量增加。鹽度處理可以增加濕地物種鳶尾(Iris hexagona)中的內源JA水平。茉莉酸酯激活植物對生物脅迫(即病原體攻擊)和非生物脅迫(即鹽)的反應。在此,用鹽水處理增加了在葉和根中參與茉莉酸反應的這些基因的表達水平(圖2c)。這些基因的表達增加(例如,AOS作為酶催化茉莉酸酯合成中的第一步)應該增加茉莉酮酸酯的合成,因此,它們很可能被開(kāi)心果用于應對鹽脅迫。
差異表達的基因富集到“幾丁質(zhì)結合”,其中四種基因編碼幾丁質(zhì)酶(CHIB, EP3, ChiC, AT2G43590)。植物幾丁質(zhì)酶涉及多種生物系統。植物中的一些幾丁質(zhì)酶是針對環(huán)境脅迫(如高鹽濃度,寒冷和干旱)而表達的,并且可以通過(guò)植物激素如乙烯,茉莉酸和水楊酸來(lái)上調。例如,基因ChiC編碼V類(lèi)幾丁質(zhì)酶,其表達可由茉莉酸和擬南芥鹽度引起的脅迫來(lái)誘導。研究者的轉錄組學(xué)分析表明,編碼幾丁質(zhì)酶的基因和參與JA生物合成途徑的基因可能有助于開(kāi)心果適應鹽水環(huán)境。

?圖2 鹽處理下開(kāi)心果的轉錄組數據分析
4.?不同野生種間混和
為了研究開(kāi)心果的種群歷史和適應性進(jìn)化,研究者對107個(gè)開(kāi)心果基因組進(jìn)行重測序,包括93個(gè)品種和14個(gè)野生開(kāi)心果,平均測序深度為6-8X。作者還重新測序了來(lái)自不同近緣種的35個(gè)基因組,包括P.mutica,P.khinjuk,P.integerrima和P. palaestina。用stringent GATK pipeline,發(fā)現14.77百萬(wàn)個(gè)單基因變異位點(diǎn),其中2.42百萬(wàn)個(gè)在基因區。使用鄰近法和最大似然法的系統發(fā)育分析清楚地分離了5種不同的種群,即?P.vera, P.mutica, P. khinjuk, P. integerrima, and P. palaestina。通過(guò)TreeMix程序在一些物種之間檢測到漸滲的信號,這表明雜交可能在自然界中的不同近親之間發(fā)生,并且與植物中被發(fā)現的普遍雜交一致。然而,從其他開(kāi)心果物種到馴化的開(kāi)心果沒(méi)有檢測到漸滲,這種現象來(lái)源于野生的P. vera(圖3)。

?圖3 不同野生種間的基因漸滲
5.?開(kāi)心果兩步馴化歷程
基于重測序數據,研究人員推測了這些物種的有效群體大小的變化,并發(fā)現在 Pleistocene期間發(fā)生了瓶頸事件,且在 ~200 kyr前,有效群體大小增加。系統發(fā)育樹(shù)顯示馴化和野生開(kāi)心果之間的分離(圖4a)。利用δaδi推算野生和馴化開(kāi)心果的分化時(shí)間在 ~8000年前,這與早在公元前6750年就表明開(kāi)心果種子是一種常見(jiàn)的食物這一考古記錄相似。為了深入了解開(kāi)心果種質(zhì)之間的遺傳關(guān)系,研究人員進(jìn)行了兩項經(jīng)典分析:群體結構和主成分分析(圖4b,c)。這些分析清晰的顯示栽培種質(zhì)分為兩個(gè)群。栽培種Group I的LD最高,栽培種Group II和野生開(kāi)心果的LD衰減值相近。Group II包括 Qazvini,Italiaei和Badami
Zarand在內的5種類(lèi)型的個(gè)體,且這些種質(zhì)被記錄為古代具有種子的材料(圖4d)。與系統發(fā)育樹(shù)一致,這三個(gè)品種含有較高比例的野生血統(圖4e),這些結果支持了其兩步馴化的過(guò)程,初步馴化,然后通過(guò)作物育種進(jìn)行改良。

圖4 野生和馴化開(kāi)心果的系統發(fā)育關(guān)系分析
6.?開(kāi)心果馴化的遺傳機制
群體核苷酸多態(tài)性θπ分析揭示了馴化型種質(zhì)的核苷酸多態(tài)性低于野生型種質(zhì),通過(guò)分析發(fā)現,栽培種質(zhì)中基因組上的一些區域的多態(tài)性降低,這些區域可能含有受到人工選擇的基因。此外,研究人員鑒定了栽培型和野生型樣品分化水平增加的區域。在馴化和野生的開(kāi)心果之間,在基因組上約有9.2 Mb的區域被鑒定為具有高水平的群體分化。栽培種間遺傳多樣性降低,且超過(guò)95%的閾值。遺傳多樣性減少的區域和群體分化增強的區域在馴化或育種過(guò)程中經(jīng)歷了選擇性清除。共計有665個(gè)基因定位在該區域。研究人員定位了受正向選擇的候選基因,其可能與馴化過(guò)程中重要的表型進(jìn)化相關(guān)。在開(kāi)心果馴化的過(guò)程中,其樹(shù)形大小經(jīng)歷了人工選擇(圖5a)。研究人員發(fā)現了基因SAUR55(圖5b),編碼生長(cháng)素應激蛋白,在植物的生長(cháng)過(guò)程中發(fā)揮重要的作用,其在開(kāi)心果的人工選擇下進(jìn)化而來(lái)。除此之外,基于也和根的轉錄組數據分析結果顯示,馴化種與野生種相比,基因SAUR55表現出了顯著(zhù)增加的表達水平(圖5c)。這些結果與在其它作物(如水稻和小麥)中生長(cháng)素應激性基因的選擇性清除的研究結果一致,并揭示了在作物馴化期間類(lèi)似特征性狀的人工選擇。果實(shí)重量是作物馴化和育種期間最重要的特征之一,包括開(kāi)心果。在栽培種中,品種成分與果實(shí)重量呈正相關(guān)(圖4e)。這支持了一個(gè)結論,在開(kāi)心果中,果實(shí)重量的人工選擇發(fā)生在馴化與人工選擇期間。研究人員指出,基因CYCD7-1在人工選擇的進(jìn)化下,野生種和馴化的栽培種之間具有高度的群體分化特征。該基因編碼D型細胞周期蛋白,控制細胞分裂及種子發(fā)育過(guò)程中的生長(cháng)率。CYCD7-1基因的過(guò)表達包括在胚胎和胚乳中的細胞增殖和細胞增大,其在擬南芥中導致種子過(guò)度生長(cháng)?;?em>CYCD7-1在花粉和早期發(fā)育中顯示特殊表達,但在葉和根中沒(méi)有表達。因此,有希望在未來(lái)的實(shí)驗中比較野生型和馴化型開(kāi)心果在花粉和早起發(fā)育時(shí)期CYCD7-1基因的表達,研究人員提出在CYCD7-1基因上進(jìn)行的人工選擇可能會(huì )改變開(kāi)心果的重量。
?圖5 開(kāi)心果果樹(shù)大小的人工選擇
結論
本研究為開(kāi)心果的局部適應和馴化提供了遺傳學(xué)基礎。黃連木屬物種基因組序列有助于未來(lái)的研究,以了解沙漠作物農藝和環(huán)境相關(guān)性狀的遺傳基礎。




京公網(wǎng)安備 11011302003368號