R语言分析单细胞数据Day1——下载Seurat包并进行预处理(一)

Task.1 安装Seurat,准备处理single cell data

安装Seurat时,只能安装3.2.3以下的版本,太高就不兼容!

install.packages('remotes') %安装过可以省略
remotes:: install_version("Seurat", version = "3.2.3")
# 安装不上可以更新R版本或者安装附属包

Task.2 加载Seurat包并导入数据

library(Seurat)
# 这里可以设置你的路径,三个文件(mtx数据、行名和列名)都需要加载
# 所使用的数据暂时不公开了,GEO数据库有很多
Day0_RAW <- ReadMtx( mtx = "matrix.mtx", features = "features.tsv",cells = "barcodes.tsv")

Task.3 创建Seurat格式项目

Seurat_Day0 <- CreateSeuratObject(counts = Day0_RAW,min.cells = 3,min.genes = 200)
# 初步过滤:>=3个细胞中表达的基因(min.cells = 3),>=200个基因的细胞(min.genes = 200)。可任意设置。

创建的项目:33539 features across 22609 samples within 1 assay
Task.4 质控

Seurat_Day0[["percent.mt"]] <- PercentageFeatureSet(Seurat_Day0, pattern = "^MT-")
# 这个命令是计算基因含量,这里MT是线粒体的意思
VlnPlot(Seurat_Day0, features = c("nFeature_RNA", "nCount_RNA", "percent.mt"), ncol = 3)
# 可视化一下

质控
根据第三个图片,线粒体基因含量占比25%以下的细胞才保留
线粒体是生物大分子,线粒体较多的细胞说明有细胞有可能已经失活,并且噪音也就变的非常多(大佬LR讲解的)
接下来可视化RNA-基因含量,RNA-feature

plot1 <- FeatureScatter(Seurat_Day0, feature1 = "nCount_RNA", feature2 = "percent.mt")
plot2 <- FeatureScatter(Seurat_Day0, feature1 = "nCount_RNA", feature2 = "nFeature_RNA")
plot1 + plot2
# 这个可视化感觉要更好看一些

质控2
上面两个可视化是为了根据内容确定筛选的细胞数目和基因数目。下面代码才是最重要的质控代码

#过滤具有超过 8000 或少于 200 个独特特征的细胞,过滤>25%的线粒体(线粒体不清楚为何过滤)
Seurat_Day0_fit <- subset(Seurat_Day0, subset = nFeature_RNA > 200 & nFeature_RNA < 8000 & percent.mt < 25)

质控后的项目:33539 features across 22433 samples within 1 assay (删除了部分低表达的细胞)

Task.5 标准化
对每个细胞的表达量进行归一化(常用“LogNormalize”),将其乘以比例因子(默认为 10,000),并对结果进行对数转换(这个是必须的)

Seurat_Day0_fit_norm <- NormalizeData(Seurat_Day0_fit , normalization.method = "LogNormalize", scale.factor = 10000)
#这些参数都是默认值,可以不写

至此,数据预处理结束,接下来是降维、聚类等分析。

  • 11
    点赞
  • 78
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值