执行UMAP可视化需要运行PCA降维,PCA降维之前需要缩放数据到一定规模!
接上一篇结果:预处理后的数据
R语言分析单细胞数据Day1——下载Seurat包并进行预处理(一)
Task.1 缩放数据
all.genes <- rownames(Seurat_Day0_fit_norm) #Seurat_Day0_fit_norm这个是上一节的名字,换成自己的项目名即可
Seurat_Day0_fit_norm<-FindVariableFeatures(Seurat_Day0_fit_norm) #找到所有特征(可不执行)
Seurat_Day0_fit_norm_sca<- ScaleData(Seurat_Day0_fit_norm)
#Seurat_Day0_fit_norm_sca<- ScaleData(Seurat_Day0_fit_norm, features = all.genes)
#这里是对所有基因进行缩放,官方说如果只是为了降维和聚类,那么这里采用默认值(2000)即可
Task.2 PCA降维
Seurat_Day0_fit_norm_pca <- RunPCA(Seurat_Day0_fit_norm_sca,
features = VariableFeatures(object = Seurat_Day0_fit_norm_sca))
#参数默认即可
Task.3 UMAP可视化
#先找到最佳聚类数
Seurat_Day0_fit_norm_pca_c <- FindNeighbors(Seurat_Day0_fit_norm_pca, dims = 1:10)
Seurat_Day0_fit_norm_pca_c <- FindClusters(Seurat_Day0_fit_norm_pca_c, resolution = 0.5)
# 一般出错的话都是前面PCA和缩放错误
UMAP <- RunUMAP(Seurat_Day0_fit_norm_pca_c, dims = 1:10)
DimPlot(UMAP, reduction = "umap")
以上为UMAP可视化,修改resolution越小可使得细胞种群数目越少,设置resolution=0.1,结果如下。
至此,数据降维、聚类结束,接下来寻找数据Marker Gene,鉴定细胞类型。