Seurat常规聚类和SCTransform脚本汇总

Seurat常规聚类与SCTransform脚本汇总

原创

已于 2025-06-25 10:17:58 修改 · 518 阅读

8 ·

CC 4.0 BY-SA版权

文章标签：

#聚类 #数据挖掘 #机器学习 #r语言 #r语言-4.2.1

于 2025-06-25 10:16:37 首次发布

前沿

单细胞常规分析用得最多的软件非R语言的Seurat包莫属，当然还有Python语言的Scanpy，但是对于入门者来说，R语言更容易上手，而且很多单细胞分析的扩展包也是基于Seurat的，或者很多R包的输入就是Seurat参数。
然而，对于数据量较大的情况，R语言就显得很鸡肋，不仅耗运行内存而且很慢，因此基于Python的软件包更为适合分析大数据，而且R语言能实现的Python基本上都能实现。随着单细胞组学的迅速发展，未来数据也将迎来超大量级的产出，基于Python的软件包应该更有前景。
言归正传，因为Seurat的常规聚类基本不变，本文主要把此流程封装成函数，这样之后调用起来都比较方便和简洁。

常规流程版

下面的函数经过NormalizeData和ScaleData常规聚类步骤，还可以根据需求设置参数。

obj，Seurat对象
mt.pattern或mt.list，mt.pattern模糊匹配线粒体基因名，mt.list给定线粒体基因向量
dim.use,PCA主成分数目
mt.cutoff，线粒体百分比阈值
nf.low或nf.high，基因数下限或上下
nfeatures，选取高变基因数目
res，亚群分辨率

seob_cluster <- function(obj,
                         mt.pattern="^MT-",mt.list=NULL,dim.use=30,mt.cutoff=10,
                         nf.low=200,nf.high=6000,nfeatures=3000,
                         res=1) {
all <- obj
if (is.null(mt.list)) {
all[["percent.mt"]] <- PercentageFeat