Seurat | 完美整合单细胞测序数据(部分交集数据的整合)(一)

1写在前面

之前我们介绍了SeuratHarmonyrliger三个包,用于3'5'数据合并的方法。🤒
但有时候我们会遇到两个datasets只有部分重叠,这和之前介绍的方法就有一点不同了。🤨

2用到的包

rm(list = ls())
library(Seurat)
library(SeuratDisk)
library(SeuratWrappers)
library(patchwork)
library(harmony)
library(rliger)
library(RColorBrewer)
library(tidyverse)
library(reshape2)
library(ggsci)
library(ggstatsplot)

3示例数据

这里我们提供13’ PBMC dataset1whole blood dataset。😉

umi_gz <- gzfile("./GSE149938_umi_matrix.csv.gz",'rt')  
umi <- read.csv(umi_gz,check.names = F,quote = "")

matrix_3p <- Read10X_h5("./3p_pbmc10k_filt.h5",use.names = T)

创建Seurat对象。🧐

srat_wb <- CreateSeuratObject(t(umi),project = "whole_blood")
srat_3p <- CreateSeuratObject(matrix_3p,project = "pbmc10k_3p")
rm(umi_gz)
rm(umi)
rm(matrix_3p)
srat_wb
srat_3p
alt

alt

4修改metadata

为了方便后续分析,这里我们对metadata进行一下注释修改。 😁

colnames(srat_wb@meta.data)[1] <- "cell_type"
srat_wb@meta.data$orig.ident <- "whole_blood"
srat_wb@meta.data$orig.ident <- as.factor(srat_wb@meta.data$orig.ident)
head(srat_wb[[]])
alt

5基础质控

做一下标准操作,计算线粒体基因核糖体基因。🥳

srat_wb <- SetIdent(srat_wb,value = "orig.ident")

srat_wb[["percent.mt"]] <- PercentageFeatureSet(srat_wb, pattern = "^MT-")
srat_wb[["percent.rbp"]] <- PercentageFeatureSet(srat_wb, pattern = "^RP[SL]")
srat_3p[["percent.mt"]] <- PercentageFeatureSet(srat_3p, pattern = "^MT-")
srat_3p[["percent.rbp"]] <- PercentageFeatureSet(srat_3p, pattern = "^RP[SL]")

p1 <- VlnPlot(srat_wb, ncol = 4,
features = c("nFeature_RNA","nCount_RNA","percent.mt","percent.rbp"))

p2 <- VlnPlot(srat_3p, ncol = 4,
features = c("nFeature_RNA","nCount_RNA","percent.mt","percent.rbp"))

p1/p2
alt

6交集基因

whole blood dataset使用的是Cell Ranger GRCh38-2020A进行注释,与3’ PBMC dataset差的比较多,所以我们先看一下有多少共同基因吧。🤩

# table(rownames(srat_3p) %in% rownames(srat_wb))
common_genes <- rownames(srat_3p)[rownames(srat_3p) %in% rownames(srat_wb)]

length(common_genes)
alt

7过滤基因

我们设置一下过滤条件,把一些表达过低过高的细胞去掉,以及一些线粒体基因过高的细胞(细胞状态不佳)。✌️

srat_3p <- subset(srat_3p, subset = nFeature_RNA > 500 & nFeature_RNA < 5000 & percent.mt < 15)
srat_wb <- subset(srat_wb, subset = nFeature_RNA > 1000 & nFeature_RNA < 6000)

srat_3p <- srat_3p[rownames(srat_3p) %in% common_genes,]
srat_wb <- srat_wb[rownames(srat_wb) %in% common_genes,]

8数据整合

8.1 合并为list

wb_list <- list()
wb_list[["pbmc10k_3p"]] <- srat_3p
wb_list[["whole_blood"]] <- srat_wb

8.2 Normalization与特征基因

for (i in 1:length(wb_list)) {
wb_list[[i]] <- NormalizeData(wb_list[[i]], verbose = F)
wb_list[[i]] <- FindVariableFeatures(wb_list[[i]], selection.method = "vst", nfeatures = 2000, verbose = F)
}

8.3 寻找Anchors并整合数据

wb_anchors <- FindIntegrationAnchors(object.list = wb_list, dims = 1:30)
wb_seurat <- IntegrateData(anchorset = wb_anchors, dims = 1:30)
rm(wb_list)
rm(wb_anchors)
alt

9整合效果可视化

9.1 整合前

DefaultAssay(wb_seurat) <- "RNA"
wb_seurat <- NormalizeData(wb_seurat, verbose = F)
wb_seurat <- FindVariableFeatures(wb_seurat, selection.method = "vst", nfeatures = 2000, verbose = F)
wb_seurat <- ScaleData(wb_seurat, verbose = F)
wb_seurat <- RunPCA(wb_seurat, npcs = 30, verbose = F)
wb_seurat <- RunUMAP(wb_seurat, reduction = "pca", dims = 1:30, verbose = F)

DimPlot(wb_seurat,reduction = "umap") +
scale_color_npg()+
plot_annotation(title = "10k 3' PBMC and whole blood, before integration")
alt

9.2 整合后

DefaultAssay(wb_seurat) <- "integrated"
wb_seurat <- ScaleData(wb_seurat, verbose = F)
wb_seurat <- RunPCA(wb_seurat, npcs = 30, verbose = F)
wb_seurat <- RunUMAP(wb_seurat, reduction = "pca", dims = 1:30, verbose = F)

DimPlot(wb_seurat, reduction = "umap") +
scale_color_npg()+
plot_annotation(title = "10k 3' PBMC and white blood cells, after integration")
alt

10降维与聚类

10.1 聚类可视化

wb_seurat <- FindNeighbors(wb_seurat, dims = 1:30, k.param = 10, verbose = F)
wb_seurat <- FindClusters(wb_seurat, verbose = F)

ncluster <- length(unique(wb_seurat[[]]$seurat_clusters))

mycol <- colorRampPalette(brewer.pal(8, "Set2"))(ncluster)

DimPlot(wb_seurat,label = T, reduction = "umap",
cols = mycol, repel = T) +
NoLegend()
alt

10.2 具体查看及可视化

count_table <- table(wb_seurat@meta.data$seurat_clusters, 
wb_seurat@meta.data$orig.ident)
count_table

#### 可视化
count_table %>%
as.data.frame() %>%
ggbarstats(x = Var2,
y = Var1,
counts = Freq)+
scale_fill_npg()
alt

面包
最后祝大家早日不卷!~

需要示例数据的小伙伴,在公众号回复Merge2获取吧!

点个在看吧各位~ ✐.ɴɪᴄᴇ ᴅᴀʏ 〰

📍 往期精彩

📍 🤨 Google | 谷歌翻译崩了我们怎么办!?(附完美解决方案)
📍 🤩 scRNA-seq | 吐血整理的单细胞入门教程
📍 🤔 Reticulate | 如何在Rstudio中优雅地调用Python!?
📍 🤣 NetworkD3 | 让我们一起画个动态的桑基图吧~
📍 🤩 RColorBrewer | 再多的配色也能轻松搞定!~
📍 🧐 rms | 批量完成你的线性回归
📍 🤒 CMplot | 连Nature上的曼哈顿图都卷起来啦
📍 🤩 CMplot | 完美复刻Nature上的曼哈顿图
📍 🤠 Network | 高颜值动态网络可视化工具
📍 🤗 boxjitter | 完美复刻Nature上的高颜值统计图
📍 🤫 linkET | 完美解决ggcor安装失败方案(附教程)
📍 ......

本文由 mdnice 多平台发布

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
非常好的问题!首先,你需要将单细胞序数据导入到R语言中。这可以通过使用R语言中的一些常见包来实现,例如Seurat、Scanpy或scater等。这些包提供了用于处理单细胞序数据的函数和方法。 以下是一个简单的示例代码,展示了如何使用Seurat包将单细胞序数据导入到R语言中: ``` library(Seurat) # 从10x Genomics下载单细胞序数据 data <- Read10X(data.dir = "path/to/10x/data") # 创建Seurat对象 seurat_obj <- CreateSeuratObject(counts = data) # 进行数据质量控制 seurat_obj <- FilterCells(object = seurat_obj, min.cells = 3, min.features = 200) # 进行规范化和批次效应校正 seurat_obj <- NormalizeData(object = seurat_obj, normalization.method = "LogNormalize", scale.factor = 10000) seurat_obj <- FindVariableFeatures(object = seurat_obj, selection.method = "vst", nfeatures = 2000) seurat_obj <- ScaleData(object = seurat_obj, features = rownames(seurat_obj), vars.to.regress = "batch") # 进行聚类和降维 seurat_obj <- RunPCA(object = seurat_obj, features = VariableFeatures(object = seurat_obj)) seurat_obj <- FindNeighbors(object = seurat_obj, dims = 1:10) seurat_obj <- FindClusters(object = seurat_obj, resolution = 0.5) # 可视化结果 DimPlot(object = seurat_obj, reduction = "umap", group.by = "ident") ``` 这段代码将单细胞序数据读入到R语言中,并使用Seurat包中的函数对其进行了质量控制、规范化、批次效应校正、聚类和降维等处理,最后可视化了聚类结果。 希望这个例子可以帮到你!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值