中國海洋大學(xué)“海洋生物遺傳學(xué)與育種”教育部重點(diǎn)實(shí)驗室、方宗熙海洋生物進(jìn)化與發(fā)育中心包振民院士和王師教授團隊在國際生物信息數據庫領(lǐng)域頂刊Nucleic Acids Research在線(xiàn)發(fā)表了軟體動(dòng)物功能和進(jìn)化基因組學(xué)綜合數據庫“MolluscDB 2.0: a comprehensive functional and evolutionary genomics database for over 1400 molluscan species”(MolluscDB 2.0:面向超過(guò)1400個(gè)軟體動(dòng)物種類(lèi)的功能和進(jìn)化基因組學(xué)綜合數據庫)。
軟體動(dòng)物(Mollusca)是動(dòng)物界第二大門(mén)類(lèi),也是最大的海洋動(dòng)物門(mén)類(lèi)。軟體動(dòng)物起源于5億年前早寒武紀,現存種類(lèi)超過(guò)10萬(wàn)種,是進(jìn)化上最成功的無(wú)脊椎動(dòng)物群體之一。此外,許多軟體動(dòng)物也是重要水產(chǎn)經(jīng)濟物種,其占世界水產(chǎn)總產(chǎn)量高達27%。隨著(zhù)軟體動(dòng)物基因組學(xué)迅速發(fā)展,取得的重要科學(xué)發(fā)現層出不窮,極大地提升了對動(dòng)物起源和適應性演化的認知深度。聯(lián)合國內外優(yōu)勢機構,該研究團隊于2021年發(fā)起了國際萬(wàn)種軟體動(dòng)物基因組計劃(M10K project),百邁客生物助力其構建了軟體動(dòng)物綜合基因組數據庫MolluscDB(http://mgbase.qnlm.ac)。該數據庫整合了約1000份軟體動(dòng)物基因組和轉錄組學(xué)數據,并提供了多種基因組比較分析工具。自正式上線(xiàn)運行以來(lái),MolluscDB已吸引了來(lái)自70多個(gè)國家的近15000次訪(fǎng)問(wèn),成為全球范圍軟體動(dòng)物研究的重要組學(xué)資源中心。

圖1-MolluscDB數據庫國際影響力(a: 訪(fǎng)問(wèn)國家;b: 引文領(lǐng)域;c: 數據庫排名;d: 國際M10K計劃啟動(dòng))
近年來(lái),高精度、多維度的功能基因組學(xué)數據呈爆發(fā)式增長(cháng),推動(dòng)軟體動(dòng)物進(jìn)入系統生物學(xué)時(shí)代,為軟體動(dòng)物科學(xué)研究帶來(lái)新的發(fā)展機遇。然而,如何整合具有“復雜、高維、海量”特征的多組學(xué)資源,構建適用于軟體動(dòng)物生物學(xué)特性的定制分析平臺,仍是國際軟體動(dòng)物研究領(lǐng)域共同面臨的重要挑戰。為了應對這一挑戰,該研究團隊將原有MolluscDB升級為MolluscDB 2.0,系統梳理整合軟體動(dòng)物復雜高維組學(xué)數據資源,致力開(kāi)發(fā)豐富的可定制的系統生物學(xué)分析工具(包含近期開(kāi)發(fā)的PanSyn工具包,Nature Protocols 2024),打造較為系統全面的軟體動(dòng)物功能和進(jìn)化基因組學(xué)綜合分析平臺。
MolluscDB 2.0收集并整合了近4200份多組學(xué)數據資源,實(shí)現主流組學(xué)維度的全覆蓋,如高質(zhì)量基因組、bulk轉錄組、單細胞轉錄組、蛋白質(zhì)組、表觀(guān)遺傳組、微生物宏基因組等。軟體動(dòng)物多組學(xué)資源來(lái)自1450個(gè)物種,涵蓋了軟體動(dòng)物門(mén)全部8個(gè)綱和76個(gè)目中的92%,地理分布覆蓋從陸地、淡水、近海到深海,囊括了已公開(kāi)的絕大部分軟體動(dòng)物的多組學(xué)資源。

圖2-MolluscDB 2.0數據庫物種分類(lèi)和覆蓋情況總覽
MolluscDB 2.0極大提升了原有14種基礎分析模塊,包括基因組組裝信息、系統演化關(guān)系、古老化石記錄、基因序列及結構、基因功能注釋、發(fā)育時(shí)期/成體組織表達譜、基因家族、轉錄因子和轉座子等。此外,針對軟體動(dòng)物的生物學(xué)和進(jìn)化特性,MolluscDB還提供了多達20種滿(mǎn)足特定研究需要的定制分析模塊,包括泛進(jìn)化綜合分析模塊、進(jìn)化發(fā)育(evo-devo)綜合分析模塊和功能基因組綜合分析模塊(涵蓋單細胞組學(xué)、蛋白組、表觀(guān)修飾組、宏基因組)等。最終,通過(guò)將多維組學(xué)信息集成到開(kāi)發(fā)定制的基因組瀏覽器中,實(shí)現了復雜多組學(xué)信息的便捷可視化和整合分析。

圖3-MolluscDB 2.0數據庫架構和多組學(xué)功能模塊概覽
MolluscDB 2.0為軟體動(dòng)物研究領(lǐng)域提供一個(gè)物種覆蓋度較廣、組學(xué)資源較豐富、分析功能較全面的開(kāi)放獲取數據庫平臺,實(shí)現對復雜海量多組學(xué)資源的系統整合和深度分析,助力更全面地揭示軟體動(dòng)物的生物學(xué)奧秘和演化歷程,推動(dòng)認知海洋生物獨特生命過(guò)程演變規律,也將為貝類(lèi)重要基因資源發(fā)掘、遺傳育種工作等提供有力支撐。
內容來(lái)源于中國海洋大學(xué)