seurat提取表达矩阵_Seurat包------标准流程

本文提供了一步一步的Seurat包使用教程,从在RStudio中安装和加载Seurat包开始,涵盖了数据导入、质控、标准化、细胞分类、marker基因提取和感兴趣的基因探索等步骤。通过示例数据展示了如何处理单细胞RNA测序数据,并解释了如何利用Elbow方法确定主成分数量,以及如何找到细胞类型的marker基因。
摘要由CSDN通过智能技术生成

841af63f6dd665d9e4be8ca068f0f9ae.png

Seurat官网上详细的指导完全可以满足Seurat包初级使用。不过该网站是英文的,为了方便大家迅速上手,我来走一遍标准流程。我用的是Windows 10, R4.0。 我走的流程原网站地址:https://satijalab.org/seurat/v3.1/pbmc3k_tutorial.html

首先我们需要在自己的RStudio中安装Seurat包

install.packages('Seurat')
library('Seurat')
packageVersion("Seurat")
?Seurat

原参考页面中还使用了一些相关的R包,所以我们也需要一并安装上,如果你已经安装了这些包就跳过这一步

install.packages(c('dplyr','patchwork'))

安装好R包之后,我们要Load进来现在的工作环境

library(dplyr)
library(Seurat)
library(patchwork)

示例数据可以在官网下载:https://support.10xgenomics.com/ 读入的数据可以是一个矩阵,行代表基因,列代表细胞。

1.数据导入

list.files('pbmc3k_filtered_gene_bc_matrices/filtered_gene_bc_matrices/hg19')
pbmc.counts <- Read10X(data.dir = "pbmc3k_filtered_gene_bc_matrices/filtered_gene_bc_matrices/hg19")

创建Seurat对象

pbmc <- CreateSeuratObject(counts = pbmc.counts)
pbmc
str(pbmc)

数据集中测到的少于200个基因的细胞(min.features = 200)和少于3个细胞覆盖的基因(min.cells = 3)被过滤掉

pbmc <- CreateSeuratObject(counts = pbmc.counts, project = "pbmc3k", min.cells = 3, min.features = 200)

2.数据质控

质控的参数主要有两个: 1.每个细胞测到的unique feature数目(unique feature代表一个细胞检测到的基因的数目,可以根据数据的质量进行调整) 2.每个细胞检测到的线粒体基因的比例,理论上线粒体基因组与核基因组相比,只占很小一部分。所以线粒体基因表达比例过高的细胞会被过滤。

pbmc[["percent.mt"]] <- PercentageFeatureSet(pbmc, pattern = "^MT-")
VlnPlot(pbmc, fe
  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值