使用CytoTRACE来辅助monocle确定发育顺序和起始点

使用CytoTRACE来辅助monocle确定发育顺序和起始点,第1张

我们做肿瘤研究的单细胞数据,一般来说会初步选择很粗狂的定义大的细胞亚群,比如我常用的 第一次分群是通用规则是:

immune (CD45+,PTPRC),epithelial/cancer (EpCAM+,EPCAM),stromal (CD10+,MME,fibo or CD31+,PECAM1,endo)

参考我前面介绍过 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,这3大单细胞亚群构成了肿瘤免疫微环境的复杂。绝大部分文章都是抓住免疫细胞亚群进行细分,包括淋巴系(T,B,NK细胞)和髓系(单核,树突,巨噬,粒细胞)的两大类作为第二次细分亚群。但是也有不少文章是抓住stromal 里面的 fibro 和endo进行细分,并且编造生物学故事的。

前面我们已经介绍了心肝脾肺肾等多个器官的上皮细胞的细分亚群, 以及免疫细胞里面的髓系和B细胞细分亚群,详见:

B细胞细分亚群髓系免疫细胞细分亚群

其中髓系的(单核,树突,巨噬,粒细胞)各种细分亚群,主要是树突细胞细分亚群比较多,是cDC1,cDC2,cDC3,以及pDC,因为cDC1,cDC2,cDC3很明显是有发育顺序的, 如果对cDC1,cDC2,cDC3合并起来的表达量矩阵做拟时序,虽然可以出结果,但是如果对cDC1,cDC2,cDC3的背景知识不够,就很难确定发育顺序和起始点。有一个技巧可以介绍给大家,就是使用CytoTRACE来辅助monocle确定发育顺序和起始点。出自于张泽民的文章:《A pan-cancer single-cell transcriptional atlas of tumor infiltrating myeloid cells》,可以看到:

使用CytoTRACE来辅助monocle确定发育顺序和起始点,第2张

张泽民的文章

可以看到,作者在拟时序上面标注了发育顺序,就是cDC1,cDC2都会发育成为cDC3(也就是LAMP3阳性的),那么作者是如何得出这样的推断了呢,在文章的附件有描述:

(A) CytoTRACE analysis of the origins of LAMP3+ cDCs. Combined application of CytoTRACE and Monocle2 to predict the origins of LAMP3+ cDCs (Left). Boxplot showing the comparison of CytoTRACE score between different cDC subsets (Right). Unpaired two-sided Wilcoxon test.

使用CytoTRACE来辅助monocle确定发育顺序和起始点,第3张

CytoTRACE

这个CytoTRACE的使用方法很早以前就介绍过,使用cytoTRACE评估不同单细胞亚群的分化潜能

然后拟时序我们也有丰富的笔记:

简单直接的拟时序分析方法,R包SCORPIUS推荐把基因表达量画在拟时序结果图上拟时序分析就是差异分析的细节剖析学徒作业

针对TENxPBMCData包里面的pbmc数据集进行降维聚类分群,安装和加载:

# BiocManager::install('TENxPBMCData') # (286 KB)
library(TENxPBMCData)
args(TENxPBMCData) 

因为这个包,TENxPBMCData 本身文件并不大,所以它其实也是需要在线下载数据的。目前它有如下所示的10个数据可以下载:

pbmc68kfrozen_pbmc_donor_afrozen_pbmc_donor_bfrozen_pbmc_donor_cpbmc33kpbmc3kpbmc6kpbmc4kpbmc8kpbmc5k-CITEseq

每个数据集都有自己的代号:

function (dataset = c("pbmc4k", "pbmc68k", "frozen_pbmc_donor_a", 
 "frozen_pbmc_donor_b", "frozen_pbmc_donor_c", "pbmc33k", 
 "pbmc3k", "pbmc6k", "pbmc8k", "pbmc5k-CITEseq"), as.sparse = TRUE) 

本次学徒作业就是针对上面的pbmc68k进行降维聚类分群,然后找到里面的树突细胞后走monocle2和CytoTRACE,帮我看看它们的发育情况,是不是跟作者里面的癌症样品里面的树突类似。

                   分割线

强烈建议你推荐给身边的博士后以及年轻生物学PI,多一点数据认知,让他们的科研上一个台阶:

生物信息学马拉松授课(买一得五) ,你的生物信息学入门课(4月3号开课)144线程640Gb内存服务器共享一年仍然是仅需800千呼万唤始出来的独享生物信息学云服务器

再怎么强调生物信息学数据处理的计算机基础都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:

生信分析人员如何系统入门R(2019更新版)》《生信分析人员如何系统入门Linux(2019更新版)
DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » 使用CytoTRACE来辅助monocle确定发育顺序和起始点

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情