近日,華中農業(yè)大學(xué)動(dòng)物科技學(xué)院、動(dòng)物醫學(xué)院周揚副教授的研究成果在Genome Research雜志作為封面文章發(fā)表。研究構建了目前牛泛基因組和基因組結構變異數據庫,并對牛的遺傳多樣性和選擇適應性提出新見(jiàn)解。
近日,華中農業(yè)大學(xué)楊利國教授團隊的周揚副教授與美國農業(yè)部George E. Liu團隊合作在Genome Research雜志發(fā)表題為“Assembly of a pangenome for global cattle reveals missing sequences and novel structural variations, providing new insights into their diversity and evolutionary history”的論文,并被選為雜志的封面文章。該文章鑒定出牛參考基因組之外的83Mb新序列,率先從群體水平構建了牛泛基因組;同時(shí)開(kāi)發(fā)基因組結構變異(Structural Variation, SV)分析流程,首次從SV的角度解析了世界牛品種的血統關(guān)系,從適應性等多角度檢測了不同分類(lèi)群體的受選擇位點(diǎn)和候選基因,補充了SV作為牛育種材料的不足,并解析SV潛在形成機理促進(jìn)對?;蚪M演化的深入理解。百邁客為該研究提供了二代測序服務(wù)。

圖1?Genome?Research雜志2022年8月份期刊封面
參考基因組序列是保障一切與基因相關(guān)研究順利實(shí)施的必要基礎。2003年長(cháng)達13年之久的人類(lèi)參考基因組計劃(85%完整度)為人類(lèi)解析生命活動(dòng)開(kāi)啟了新篇章,被譽(yù)為與阿波羅登月計劃和曼哈頓計劃同等重要的大事件。牛參考基因組于2009年發(fā)布,在之后的13年內不斷對其進(jìn)行完善,并相繼公布了近10個(gè)牛品種的參考基因組。但每個(gè)參考基因組幾乎只包含單個(gè)個(gè)體基因組序列,忽略了個(gè)體之間序列的差異性,導致在科學(xué)研究過(guò)程中相當一部分基因組序列及其功能處于未知狀態(tài);同時(shí)已知基因組序列在不同個(gè)體之間存在SV,導致不同個(gè)體間基因組序列構成非常復雜,精準檢測和分型一直是阻止其后續解析和應用的障礙。

圖2泛基因組新序列在已知參考基因組上的分布及影響
為解決以上問(wèn)題,該文章通過(guò)開(kāi)發(fā)新的基因組分析流程,對來(lái)自世界57個(gè)品種898頭牛的基因組序列進(jìn)行組裝和SV檢測;發(fā)現了83Mb的?;蚪M未知序列,相當于目前參考基因組序列總長(cháng)度的3.1%,并且從中鑒定出大量未知外顯子序列,最后綜合三種策略成功將1007條contig放置在現有參考基因組上,這些序列可能通過(guò)外顯子破壞、外顯子添加等方式影響了279個(gè)基因的序列結構。

圖3利用SV(缺失型變異)對世界牛品種展開(kāi)精準群體學(xué)分析
同時(shí),利用多款SV檢測軟件重新開(kāi)發(fā)新的分析流程,在準確檢測SV的基礎上實(shí)現了對缺失型變異的邊界精準鑒定和二倍體分型;利用此流程,共檢測到了330萬(wàn)個(gè)缺失變異、12萬(wàn)個(gè)倒置、18萬(wàn)個(gè)重復區域,通過(guò)對檢測結果的模擬評估,證明本論文所檢測的SV在牛上已經(jīng)趨于飽和,具有很好的群體代表性。以此為基礎,完成了對SV對?;蚪M27種不同基因組功能元件和QTL的影響研究,構建了受SV影響的基因功能元件數據庫。進(jìn)一步利用缺失型變異對世界牛品種的血統來(lái)源進(jìn)行分析,實(shí)現基于SV水平的世界牛品種血統的精準鑒定,為解析世界牛品種血統組成提供了新方法,打破了長(cháng)期使用SNP進(jìn)行遺傳學(xué)分析的局限。
進(jìn)一步利用比較基因組學(xué)等手段對牛的種屬差異、地域適應性、商業(yè)化用途等角度全面解析獲得大量與經(jīng)濟性狀相關(guān)的變異位點(diǎn),并深入解析了位于A(yíng)PPL2第一外顯子區域缺失變異與不同地域牛選擇適應性之間的關(guān)系;發(fā)現該缺失變異是由Bov-tA1轉座子構成,并形成了APPL2基因的啟動(dòng)子和增強子部分,該序列攜帶了APPL2相關(guān)功能的轉錄因子結合位點(diǎn),通過(guò)影響基因的表達,進(jìn)而調控與免疫反應、味覺(jué)功能、細胞增殖、葡萄糖代謝相關(guān)的功能。
周揚副教授和其碩士研究生楊旅同學(xué)為該論文共同第一作者,George E. Liu、楊利國教授和周揚副教授為共同通訊作者。該研究受到國家自然科學(xué)基金、湖北省自然科學(xué)基金、美國AFRI和NIFA等項目的資助。
如果您對基因組項目有任何技術(shù)問(wèn)題,歡迎點(diǎn)擊下方按鈕與我們聯(lián)系,我們將免費為您設計文章研究思路。
A cattle pangenome representation was created based on the genome sequences of 898 cattle representing 57 breeds. The?pangenome identified 83 Mb of sequence not found in the cattle reference genome, representing 3.1% novel sequence compared with the 2.71-Gb reference. A catalog of structural variants developed from this cattle population identified 3.3 million deletions, 0.12 million inversions, and 0.18 million duplications. Estimates of breed ancestry and hybridization between?cattle breeds using insertion/deletions as markers were similar to those produced by single nucleotide polymorphism–based analysis. Hundreds of deletions were observed to have stratification based on subspecies and breed. For example,?an insertion of a Bov-tA1 repeat element was identified in the first intron of the APPL2 gene and correlated with cattle breed?geographic distribution. This insertion falls within a segment overlapping predicted enhancer and promoter regions of the?gene, and could affect important traits such as immune response, olfactory functions, cell proliferation, and glucose metabolism in muscle. The results indicate that pangenomes are a valuable resource for studying diversity and evolutionary history, and help to delineate how domestication, trait-based breeding, and adaptive introgression have shaped the cattle?genome.



京公網(wǎng)安備 11011302003368號