隨著(zhù)代謝組學(xué)的飛速發(fā)展,分析技術(shù)的不斷更新,鑒定到的代謝物在數據量和種類(lèi)上也在以“5G”的速度不斷累積。面臨這樣龐大又復雜的代謝物數據,搞清楚他們是什么、發(fā)揮什么作用至關(guān)重要。今天,小編就給大家介紹兩個(gè)代謝組學(xué)常見(jiàn)的代謝組學(xué)數據庫—Pubchem和KEGG,并手把手教大家如何利用這些數據庫認識我們的代謝物。
Pubchem(https://pubchem.ncbi.nlm.nih.gov/),它是NCBI下的一個(gè)大型的、綜合性的化合物數據庫,目前收錄了1億多種化合物信息,支持名稱(chēng)、縮寫(xiě)、化學(xué)式、系統命名等多種方式檢索,其結果包含了化合物的各種命名、相關(guān)聯(lián)的數據庫信息、結構、分類(lèi)、理化性質(zhì)、文獻、質(zhì)譜圖等多種信息。其中頁(yè)面開(kāi)頭的摘要部分可快速了解到該物質(zhì)的特性、生物功能等信息,根據提供的文獻信息可幫助我們了解目前的研究情況。今天小編以“癸酸”為例教大家如何快速了解一個(gè)陌生的代謝組化合物。首先我們在主頁(yè)搜索欄中輸入癸酸英文名Decanoic acid,點(diǎn)擊搜索后會(huì )得到多個(gè)結果,置頂的一般為最佳匹配,這里是完全一致的,可以確認就是這個(gè)結果。
點(diǎn)擊名稱(chēng)可打開(kāi)詳情頁(yè)面,網(wǎng)頁(yè)開(kāi)頭的總結部分展示了化合物的ID、化學(xué)結構、分子式、同義詞、簡(jiǎn)介等信息,閱讀簡(jiǎn)介可快速了解到它是一種脂肪酸,具有抗菌、消炎等作用,是人體和植物中都存在的代謝物。此外右側導航條列出了多種信息方便快速跳轉。
接下來(lái),我們可能想找到這個(gè)化合物對應的KEGG注釋信息,這里介紹兩種快速簡(jiǎn)單的方法:一種是點(diǎn)擊右側導航欄的Names and Identifiers(一般是第二項),在跳轉地方找到Depositor-Supplied Synonyms(可使用Ctrl+F輸入關(guān)鍵詞搜索)同義詞列表,了解KEGG數據庫的熟手可以一眼找到對應的KEGG ID為C01571。
不能快速定義上述方法中的KEGG ID的也沒(méi)關(guān)系,我們可以直接在頁(yè)面搜索關(guān)鍵詞“KEGG”,很快就找到了(下圖):
點(diǎn)擊上述找到的鏈接(上圖箭頭)就看到其ID為C01571。
對于想找其他數據庫的信息,也可采取上述的方法。
前文提到的KEGG(https://www.genome.jp/kegg/compound/)數據庫相信大家都不陌生,它是日本京都大學(xué)和東京大學(xué)聯(lián)合開(kāi)發(fā)的數據庫。它有一個(gè)化合物庫,記錄了與通路相關(guān)的化合物,其化合物ID以C開(kāi)頭,百邁客的分析結果提供了這個(gè)信息。這里我們將上述得到的C01571進(jìn)行檢索:
點(diǎn)擊結果(上圖箭頭)就可以看到具體代謝物的信息,表格中展示了名稱(chēng)、分子式、結構、化學(xué)反應、通路、酶等多種信息,查看通路信息可知道其參與了脂肪酸合成,點(diǎn)擊通路map00061可跳轉查看其在通路圖中的具體位置。
如果做了其他組學(xué)分析,如轉錄組分析,可將差異基因所富集的通路、代謝富集的通路及相關(guān)聯(lián)的上下游通路聯(lián)合起來(lái)推測影響代謝物的基因,有助于基因功能的研究哦!
通過(guò)前面的檢索頁(yè)面我們會(huì )發(fā)現相同的代謝物在不同數據庫的ID不一樣,不要慌,小編給大家推薦一個(gè)好用的ID轉換網(wǎng)站:http://cts.fiehnlab.ucdavis.edu/batch。這個(gè)網(wǎng)站支持多種數據庫,而且可以批量哦!。以C01571(類(lèi)型為KEGG)為例,查詢(xún)其CAS和HMDB信息,見(jiàn)下圖:
點(diǎn)擊covert可得到轉換的信息,還可下載列表保存。真是方便又實(shí)用!
好啦~小編的入門(mén)介紹就到這了。通過(guò)這些數據庫的簡(jiǎn)單搜索就可讓我們大致了解代謝物的基本信息和生物功能,還等什么,趕緊動(dòng)起手來(lái)了解你身邊陌生的代謝物吧!