前沿
单细胞常规分析用得最多的软件非R语言的Seurat包莫属,当然还有Python语言的Scanpy,但是对于入门者来说,R语言更容易上手,而且很多单细胞分析的扩展包也是基于Seurat的,或者很多R包的输入就是Seurat参数。
然而,对于数据量较大的情况,R语言就显得很鸡肋,不仅耗运行内存而且很慢,因此基于Python的软件包更为适合分析大数据,而且R语言能实现的Python基本上都能实现。随着单细胞组学的迅速发展,未来数据也将迎来超大量级的产出,基于Python的软件包应该更有前景。
言归正传,因为Seurat的常规聚类基本不变,本文主要把此流程封装成函数,这样之后调用起来都比较方便和简洁。
下面的函数经过NormalizeData和ScaleData常规聚类步骤,还可以根据需求设置参数。
- obj,Seurat对象
- mt.pattern或mt.list,mt.pattern模糊匹配线粒体基因名,mt.list给定线粒体基因向量
- dim.use,PCA主成分数目
- mt.cutoff,线粒体百分比阈值
- nf.low或nf.high,基因数下限或上下
- nfeatures,选取高变基因数目
- res,亚群分辨率
seob_cluster <- function(obj,
mt.pattern="^MT-",mt.list=NULL,dim.use=30,mt.cutoff=10,
nf.low=200,nf.high=6000,nfeatures=3000,
res=1) {
all <- obj
if (is.null(mt.list)) {
all[["percent.mt"]] <- PercentageFeat
Seurat常规聚类与SCTransform脚本汇总

最低0.47元/天 解锁文章
2997

被折叠的 条评论
为什么被折叠?



