隨著(zhù)單細胞技術(shù)的普及與應用,實(shí)驗流程中的質(zhì)控標準、Cell Ranger和Seurat等軟件的分析內容,已不再是單細胞小白的困擾,目前單細胞測序的難點(diǎn)在于獲取測序數據后,基于標準分析結果如何進(jìn)行后續的數據挖掘,進(jìn)一步解釋生物學(xué)現象。
單細胞測序數據挖掘方向
數據處理? | 細胞分群注釋? | 差異分析? | 功能分析? | 細胞通訊分析? |
|
|
|
|
|
發(fā)育軌跡分析? | 轉錄調控分析? | 腫瘤異質(zhì)性分析? | 臨床相關(guān)性分析? | 單細胞聯(lián)合空間? |
|
|
|
|
|
單細胞測序數據個(gè)性化分析方法
單細胞測序數據的挖掘方向復雜多樣,針對不同領(lǐng)域的生物學(xué)表型和機理研究,需要持續不斷地開(kāi)發(fā)個(gè)性化分析內容,從不同的角度進(jìn)行個(gè)性化數據挖掘,以下就是單細胞測序數據個(gè)性化分析的幾個(gè)分析方向:
1、單細胞測序個(gè)性化分析方法:細胞軌跡分析–揭示細胞發(fā)育分化動(dòng)態(tài)軌跡
細胞軌跡分析可以在單細胞分辨率驗證已知的細胞分化關(guān)系,推斷未知的細胞分化路徑,挖掘一些稀少的中間狀態(tài)細胞,解析細胞分化過(guò)程中的起調控作用的關(guān)鍵基因,在發(fā)育生物學(xué)中細胞分化、譜系發(fā)育研究方向、腫瘤/疾病微環(huán)境中免疫細胞的動(dòng)態(tài)變化研究中均有廣泛應用。目前進(jìn)行細胞軌跡分析的方法和軟件非常之多,大致可以概括為兩種方法,一種是以monocle軟件為代表的擬時(shí)序分析(pseudotime analysis),另一種則是以velocyto /scVelo為主的RNA速度分析(RNA velocity)。詳情>>單細胞數據分析沒(méi)有思路?試試細胞軌跡分析~(內附代碼)
2、單細胞測序個(gè)性化分析方法:細胞通訊分析–解析細胞間的信號通訊關(guān)系
多細胞生物是由很多不同類(lèi)型細胞組成的開(kāi)放而復雜體系,配體受體復合物介導的細胞間通訊對協(xié)調發(fā)育、分化和炎癥等多種生物學(xué)過(guò)程至關(guān)重要。細胞通訊分析,又稱(chēng)細胞受體-配體互作分析,是以細胞亞群的基因表達量數據為研究對象,通過(guò)獲得細胞中配體及受體基因的表達信息,比較細胞類(lèi)型之間的配體與受體基因表達差異,分析得到細胞亞群間的信號通訊關(guān)系,在闡明生物學(xué)過(guò)程中細胞間通訊的復雜性、多樣性和動(dòng)態(tài)性方面有重要意義。
3、單細胞測序個(gè)性化分析方法:GSEA/GSVA分析–基于功能基因集的富集分析策略
GSEA( Gene Set Enrichment Analysis),是2005年由Broad Institute研究開(kāi)發(fā)的一種基于基因集的富集分析方法,用來(lái)評估一個(gè)預先定義的基因集的基因在與表型相關(guān)度排序的基因表中的分布趨勢,從而判斷其對表型的貢獻。GSEA是從所有基因的表達豐度出發(fā),分析在不同的通路中的基因的整體表達影響,這也是區別于GO/KEGG富集分析的地方,GSEA不需要設定差異閾值篩選目標基因集,理論上更容易囊括細微但協(xié)調性的變化對生物通路的影響。Broad研究所在GSEA發(fā)布8年之后,開(kāi)發(fā)了GSVA(Gene Set Variation Analysis)算法來(lái)拓展基因集分析的應用。GSEA分析主要用于兩兩組間比較的方案設計中,對于分組比較復雜的方案設計則比較適合GSVA分析,GSVA不需要預先進(jìn)行樣本之間的差異分析,依據表達矩陣就可以計算每個(gè)樣本中特定基因集的變異分數。
4、單細胞測序個(gè)性化分析方法:腫瘤拷貝數變異分析–揭示惡性細胞表型
拷貝數變異(Copy number variation, CNV)是由基因組發(fā)生重排而導致的,基因組大片段的拷貝數增加或者減少,基因組結構變異(Structural variation, SV) 的重要組成部分,也是人類(lèi)疾病的重要致病因素之一。與正常細胞相比,腫瘤基因組部分區域呈現過(guò)表達或低表達狀態(tài),通過(guò)與一組參考的“正?!奔毎啾?,比較不同樣本間或不同細胞類(lèi)型之間的CNV基因表達差異,探索腫瘤基因組位置上基因的表達強度,最終反映基因大片段區域的CNV事件,鑒定體細胞整個(gè)染色體或大片段染色體的擴增或缺失。
5、單細胞測序個(gè)性化分析方法:轉錄因子活性分析–挖掘關(guān)鍵調控轉錄因子
單細胞研究通常會(huì )涉及到一個(gè)核心關(guān)鍵問(wèn)題:細胞的異質(zhì)性以及這種異質(zhì)性是如何發(fā)展和維持的。這種細胞異質(zhì)性很大程度上是由潛在的基因調控網(wǎng)絡(luò )決定的,特定轉錄因子(transcription factor,TF)集合的協(xié)同表達驅動(dòng)各自靶標基因的表達,從而建立特定的基因表達譜。因此,單細胞的基因調控網(wǎng)絡(luò )對于深入挖掘細胞異質(zhì)性背后的生物學(xué)意義是至關(guān)重要的。利用pySCENIC從單細胞轉錄組數據中推斷TF、基因調控網(wǎng)絡(luò )和細胞類(lèi)型,基本原理是基于共表達和DNA調控保守序列(motif)分析推斷基因調控網(wǎng)絡(luò ),然后在每個(gè)細胞中分析網(wǎng)絡(luò )活性以鑒定細胞狀態(tài)。
6:、單細胞測序個(gè)性化分析方法:加權基因共表達網(wǎng)絡(luò )分析–篩選表型相關(guān)核心調控網(wǎng)絡(luò )
加權基因共表達網(wǎng)絡(luò )分析(Weighted Gene Co-expression Network Analysis, WGCNA)是構建基因共表達網(wǎng)絡(luò )的常用方法,可以探索模塊與特定表型或疾病的關(guān)聯(lián)關(guān)系,最終達到鑒定基因網(wǎng)絡(luò )的目的;單細胞測序技術(shù)可以揭示特定腫瘤組織中的細胞特異性,對細胞進(jìn)行分類(lèi),并且識別特定的標志物,但其檢測的細胞數量和病例來(lái)源都是有限的。利用WGCNA分析單細胞轉錄組測序數據,可以提供一套有別于高変基因、差異分析的方法,不依賴(lài)于數據庫直接用表達量的相關(guān)性值預測調控關(guān)系,篩選某些細胞亞群中有關(guān)聯(lián)作用的基因集(稱(chēng)為模塊),可以從成千上萬(wàn)的基因中挑選出高度相關(guān)的基因的模塊,并將模塊與表型進(jìn)行關(guān)聯(lián),尋找marker gene或治療靶點(diǎn)。
7、單細胞測序個(gè)性化分析方法:單細胞空間聯(lián)合分析-解析空間結構異質(zhì)性
基因表達具有時(shí)間和空間特異性,單細胞轉錄組主要從時(shí)間上研究基因表達,能夠系統的識別組織中的細胞亞群,但沒(méi)有捕獲其空間組織信息,限制了我們對組織及細胞間相互作用的理解。而空間轉錄組的應用使得人們能夠從空間的角度解析數據,在空間上研究基因的表達。通過(guò)整合兩種數據模式,將單細胞轉錄組數據和空間轉錄組數據進(jìn)行聯(lián)合分析,在時(shí)空上分析基因的表達具有重要的意義。
如果您對以上個(gè)性化分析方案感興趣,歡迎點(diǎn)擊下方按鈕聯(lián)系我們,我們將免費為您設計文章思路文章。