参考:
跟着大神学单细胞数据分析
10X scRNA免疫治疗学习笔记-3-走Seurat标准流程
单细胞测序分析之Seurat(3.0)包学习笔记
10×单细胞测序分析练习(一)
首先,我们需要从网上下载数据,应该是一个表达矩阵,比如我们要使用的这个demo,PBMC matrix.
接下来就是在Rstudio 中的操作。
install.packages("tidyverse")
install.packages("rmarkdown")
install.packages('Seurat')
library(Seurat)
library(rmarkdown)
library(tidyverse)
#
setwd("F:/biotech/10")
pbmc.data <- read.csv("./GSE117988_raw.expMatrix_PBMC.csv",header=TRUE,row.names = 1)
dim(pbmc.data)
#对数据进行一个标准化的处理,先求每个细胞文库的总大小,然后用它的中位数除以总大小得到一个小数,然后按列乘以这个小数就相当于对文库进行了归一化,去除文库本身的大小差异
pbmc.data <- log2(1 + sweep(pbmc.data, 2, median(colSums(pbmc.data))/colSums(pbmc.data), '*'))
#这儿有1-4,这些数字代表什么呢?代表了不同的时候,即文章后面所提及到的timepoints
head(colnames(pbmc.data))
[1] "AAACCTGAGCGAAGGG.1" "AAACCTGAGGTCATCT.1" "AAACCTGAGTCCTCCT.1" "AAACCTGCACCAGCAC.1" "AAACCTGGTAACGTTC.1"
[6] "AAACCTGGTAAGGATT.1"
#读入数据这一步使用的Seurat包应该是 Seurat V3版本,创建一个对象
pbmc<- CreateSeuratObject(counts = pbmc.data, project = "10X pbmc", min.cells = 1, min.features = 0)
pbmc
head(pbmc@meta.data)
#^MT- 表示线粒体,这儿是在进行质量控制,看一下线粒体里面的数据有多少。太多了说明就是有污染
pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")
pbmc@meta.data %>% head()
VlnPlot(pbmc, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)