百邁客宏基因組分析平臺全新升級,百邁客宏基因組分析平臺擁有流暢的主流程,豐富的個(gè)性化,在39種分析基礎上,新增13種個(gè)性化分析,另還有6種個(gè)性化分析即將上線(xiàn),滿(mǎn)足您的定制化要求。
新增分析如下:
物種組成分析:新增upset圖,厚壁菌門(mén)/擬桿菌門(mén)比例;
個(gè)性化功能注釋?zhuān)盒略鯪cyc數據庫注釋、分泌蛋白預測、T3SS效應蛋白預測、TCDB轉運蛋白分類(lèi)注釋
Beta多樣性分析:PLS-DA分析、分型分析
Alpha多樣性分析:Alpha多樣性指數、稀釋曲線(xiàn)、香農指數曲線(xiàn)、等級豐度曲線(xiàn)相關(guān)性與關(guān)聯(lián)分析:物種與功能貢獻度分析
下面給各位老師介紹其中11項個(gè)性化分析內容,感興趣的老師可以聯(lián)系當地銷(xiāo)售體驗,另外轉發(fā)本篇微信推文至朋友圈,集贊20+,保留12h以上,即可獲得微生物多樣性云分析一個(gè)月的免費體驗 或 一次宏基因組(限6個(gè)樣本)的標準分析和個(gè)性化分析體驗權限?;顒?dòng)時(shí)間:2021.10.23-2021.11.2
宏基因組免費課程:http://live.biocloud.net/my/course/208
宏基因組分析平臺總覽
組成物種分析
1.upset圖
維恩圖(Venn diagram)是十九世紀英國數學(xué)家約翰·維恩(John Venn)發(fā)明,用于展示集合之間大致關(guān)系的一類(lèi)圖形。其中圈或橢圓重合(overlap)的部分就是集合與集合間元素的交集,非重疊部分則為特定集合的特有元素。集合圖均可用于對集合共有和特有元素信息進(jìn)行可視化,但是當數據分組過(guò)多(>4)時(shí),維恩圖看起來(lái)會(huì )非常雜亂,而集合圖可以展示≥5個(gè)分組的集合元素共有和特有信息。統計樣品之間的共有、特有元素。應用范圍:適用于微生物、轉錄組、代謝組、單細胞等組學(xué)。如分析組間共有、特有物種;分析各比較組顯著(zhù)差異的共有、特有pathway/基因等。
圖1. upset示例,展示Group1/Group2兩組組間共有和特有元素的數量
2.厚壁菌門(mén)/擬桿菌門(mén)比例
圖2 展示不同樣本厚壁菌門(mén)/擬桿菌門(mén)比例
個(gè)性化功能注釋
1.Ncyc數據庫注釋
NCycDB(https://github.com/qichao1984/NCyc)是一個(gè)人工校正后的氮循環(huán)相關(guān)基因數據庫。NCycDB 共包含 68 個(gè)基因(亞)家族,涵蓋 8 個(gè) N 循環(huán)過(guò)程,分別具有 95% 和 100% 同一性截止值的84,759和219,146個(gè)代表性序列,還確定了 1958 個(gè)同源直系同源組,并在數據庫中包含了相應的序列,以避免由于“小數據庫”問(wèn)題導致的假陽(yáng)性分配。NCycDB可用于快速而準確地對氮循環(huán)基因進(jìn)行宏基因組學(xué)分析。
圖3.Ncyc數據庫注釋
2. T3SS效應蛋白注釋
三型分泌系統(type Ⅲ secretion system,TTSS,T3SS)是一個(gè)由多組分蛋白復合體形成的跨膜通道,它不依賴(lài)sec通過(guò)分泌蛋白或把這些毒力蛋白直接注入宿主細胞發(fā)揮致病作用,是許多革蘭陰性致病菌中存在的復雜的分子裝置。TTSS蛋白可以分成 4類(lèi):1)細胞膜結構裝置蛋白 ( bacterialmembrane apparatus proteins),負責分泌系統組裝;2) 轉位蛋白 ( tranl ocon proteins ),在細胞膜上形成使效應蛋白得以通過(guò)的小孔;3)效應蛋白 ( translocated effect of proteins ),與病原的致病作用密切相關(guān),能夠引起宿主細胞相應的病理變化;4) TTSS分子伴侶 ( type Ⅲ chaper ones) ,能夠有效地轉移效應蛋白,保護其在未分泌之前不被降解。
圖4.T3SS效應蛋白注釋
3. TCDB轉運蛋白分類(lèi)注釋
TCDB(Transporter Classification Database)是包含各種轉運蛋白的蛋白序列并對收錄的蛋白進(jìn)行分類(lèi)的數據庫。這個(gè)數據庫的分類(lèi)是依據于TC系統進(jìn)行的分類(lèi)(Transporter Classification system),具體的類(lèi)別信息由TC號(TC number)標注,TC number由點(diǎn)分割的五組字符(D1.L1.D2.D3.D4)組成:D1(單個(gè)數字)代表相應的轉運蛋白類(lèi)(如通道蛋白、載體等);L1(單個(gè)字母)相應于轉運蛋白亞類(lèi);D2(數字)代表相應的轉運蛋白家族;D3(數字)代表相應的轉運蛋白亞家族;D4(數字)相應于具體的轉運蛋白本身。雖然在一些家族中有些轉運蛋白可能利用多種作用模型或者可能利用不同于該家族中的其它蛋白的機制,但是對于大多數轉運蛋白家族來(lái)說(shuō),家族中的成分具有相似的功能和作用機制。
圖5.TCDB轉運蛋白分類(lèi)注釋
Beta多樣性分析
1.PLS-DA分析
偏最小二乘判別分析(Partialleast squares discriminant analysis,PLS-DA)是多變量數據分析技術(shù)中的判別分析法,經(jīng)常用來(lái)處理分類(lèi)和判別問(wèn)題。通過(guò)對主成分適當的旋轉,PLS-DA可以有效的對組間觀(guān)察值進(jìn)行區分,并且能夠找到導致組間區別的影響變量。PLS-DA采用了經(jīng)典的偏最小二乘回歸模型,其響應變量是一組反應統計單元間類(lèi)別關(guān)系的分類(lèi)信息,是一種有監督的判別分析方法。因無(wú)監督的分析方法(PCA)對所有樣本不加以區分,即每個(gè)樣本對模型有著(zhù)同樣的貢獻,因此,當樣本的組間差異較大,而組內差異較小時(shí),無(wú)監督分析方法可以明顯區分組間差異;而當樣本的組間差異不明晰,而組內差異較大時(shí),無(wú)監督分析方法難以發(fā)現和區分組間差異。另外,如果組間的差異較小,各組的樣本量相差較大,樣本量大的那組將會(huì )主導模型。有監督的分析(PLS-DA)能夠很好的解決無(wú)監督分析中遇到的這些問(wèn)題。
圖6.PLS-DA分析
2.分型分析
分型分析,主要通過(guò)統計聚類(lèi)的方法研究不同樣本菌群物種/功能結構的分型情況。分型分析過(guò)程中一般不考慮環(huán)境因子等外部因素的影響。通過(guò)分型分析,可以將菌群物種/功能結構相似的不同樣本聚為一類(lèi),主要適用于特定環(huán)境樣本的菌群/功能分型,如腸道型(enterotypes)、口腔分型等。通常根據菌群在所選分類(lèi)水平上的相對豐度,計算 Jensen-Shannon Distance和PAM (Partitioning Around Medoids)進(jìn)行聚類(lèi),通過(guò) Calinski-Harabasz (CH)指數計算最佳聚類(lèi) K 值,然后采用 Between-class analysis (BCA)或principal coordinates analysis (PCoA)進(jìn)行可視化。
圖7.分型分析
相關(guān)性分析
1.物種與功能貢獻度分析
根據樣本的物種、功能的對應關(guān)系,進(jìn)行物種與功能相對豐度的關(guān)聯(lián)分析,可以得到特定物種的功能貢獻度、特定功能的物種貢獻度。該分析既可以指定kegg、eggNOG、GO、Pfam、CAZy、CARD、VFDB、PHI-base、P450數據庫的TOP/高豐度功能或代謝途徑主要存在于哪些物種,也可以分析TOP/高豐度物種的主要功能或代謝途徑。
圖8.功能對物種貢獻度圖
圖9.物種對功能貢獻度圖
2、普式分析(即將上線(xiàn))
Procrustes分析(Procrustes Analysis,普魯克分析)是一種通過(guò)分析形狀分布,比較兩組數據一致性的方法。數學(xué)上來(lái)講,就是不斷迭代,尋找標準形狀(canonical shape),并利用最小二乘法尋找每個(gè)對象形狀到這個(gè)標準形狀的仿射變化方式。該過(guò)程也稱(chēng)為最小二乘正交映射(least-squares orthogonal mapping)。Procrustes分析在面部幾何中廣泛應用,例如人臉識別。這里通過(guò)Procrustes Analysis分析物種組成和環(huán)境屬性的潛在一致性。
圖10.普式分析
3、VPA方差分解分析(即將上線(xiàn))
VPA(Variance partitioning analysis)方差分解分析,可用于定量評估兩組或多組(2~4組)環(huán)境因子變量對響應變量(如物種、功能組成)的單獨解釋度和共同解釋度,常配合RDA/CCA使用。
分析軟件:R語(yǔ)言vegan包中vpa分析。
圖11.VPA方差分解分析
4、環(huán)境因子排序回歸分析(即將上線(xiàn))
線(xiàn)性回歸(Linear Regression)分析是利用數理統計中的回歸分析,來(lái)確定兩種或兩種以上變量間相互依賴(lài)的定量關(guān)系的一種統計分析方法,在微生態(tài)研究領(lǐng)域運用十分廣泛?;跇颖緦沫h(huán)境因子(pH、有機質(zhì)含量、碳氮比等)和物種/功能豐度數據,分別對物種/功能的多樣性進(jìn)行計算,然后利用線(xiàn)性回歸模型,對樣本對應的環(huán)境因子數據與物種/功能的多樣性數據進(jìn)行線(xiàn)性回歸分析,評估環(huán)境因子與物種/功能的多樣性的一致性。當線(xiàn)性回歸決定系數R2較高時(shí),表明環(huán)境因子與物種/功能多樣性的一致性較高。
圖12.環(huán)境因子排序回歸分析
以上就是百邁客宏基因組分析平臺已上線(xiàn)和即將上線(xiàn)的個(gè)性化分析內容,百邁客也將不斷持續更新分析流程,滿(mǎn)足您多樣化的分析需求,為您的科研之路提供更便捷的測序及生信分析服務(wù)。