每列大于0的个数_生信学习|单细胞转录组学习笔记之Seurat 3.0(一)

ccf5d1e448df8d25096c7e16f4b641cc.png

在之前的文章中,已经为大家分享了几个R语言的教程,今天再为大家分享R语言的seurat包的学习笔记。

一.数据导入

本文的范例数据为seurat官网的pbmc-3k数据,文末有下载链接。当然也可以直接使用 基迪奥10X转录组结题报告中的表达量文件,如下图。

357a842b5ffac5c2d3c5b55ff1da0651.png

指定数据所在目录;

data_dir <-"C:/Users/MHY/Desktop/filtered_gene_bc_matrices/hg19"

载入seurat包;

library(Seurat)

读入pbmc数据;

pbmc.data <- Read10X(data.dir =data_dir)

查看稀疏矩阵的维度,即基因数和细胞数;

dim(pbmc.data)

[1]32738 2700

预览稀疏矩阵(1~10行,1~6列),. 表示0;

pbmc.data[1:10,1:6]

29e8fa1fae384cbca0074092604ff84e.png

二.创建Seurat对象与数据过滤

在使用CreateSeuratObject()创建对象的同时,过滤数据质量差的细胞。保留在>=3个细胞中表达的基因;保留能检测到>=200个基因的细胞。

pbmc <- CreateSeuratObject(counts =pbmc.data, project = "pbmc2700", min.cells = 3, min.features = 200)

计算每个细胞的线粒体基因转录本数的百分比(%),使用[[ ]] 操作符存放到metadata中;

pbmc[["percent.mt"]] <-PercentageFeatureSet(pbmc, pattern = "^MT-")

过滤细胞:保留gene数大于200小于2500的细胞;目的是去掉空GEMs和1个GEMs包含2个以上细胞的数据;而保留线粒体基因的转录本数低于5%的细胞,为了过滤掉死细胞等低质量的细胞数据。

pbmc <- subset(pbmc, subset =nFeature_R

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值