.metadata是什么项目文件_CNS图表复现01—读入csv文件的表达矩阵构建Seurat对象

分享是一种态度

a3dbfe9abd185fdfbc68ec39c6017274.gif

上个月我们组建了:《单细胞CNS图表复现交流群》,见:你要的rmarkdown文献图表复现全套代码来了(单细胞),也分享了单细胞转录组数据分析的流程:

  • 祖传的单个10x样本的seurat标准代码
  • 祖传的单个10x样本的seurat标准代码(人和鼠需要区别对待)
  • seurat标准流程实例之2个10x样本的项目(GSE135927数据集)

交流群里大家讨论的热火朝天,而且也都开始了图表复现之旅,在这里我还是带大家一步步学习CNS图表吧。如果你也想加入交流群,自己去:你要的rmarkdown文献图表复现全套代码来了(单细胞)找到我们的拉群小助手哈。

今天讲解第一步:读入csv文件的表达矩阵成为Seurat对象。

交流群里共享了该文章的谷歌云文件的百度云版本,方便在中国大陆的朋友们下载。

869e17ddccd2d97ee594d90d4d71f745.png

9G的文件,谷歌云文件的百度云版本

读取两个csv文件

如果是10x数据集,一般来说是每个样本都有3个文件,参考代码是:

  • 祖传的单个10x样本的seurat标准代码
  • 祖传的单个10x样本的seurat标准代码(人和鼠需要区别对待)
  • seurat标准流程实例之2个10x样本的项目(GSE135927数据集)

但是我们这个CNS文章是直接把表达矩阵给出来了csv文件,所以直接读取,代码如下:

rm(list=ls())
options(stringsAsFactors = F)
library(Seurat)
# Load data 
dir='./'
Sys.time()
raw.data "Data_input/csv_files/S01_datafinal.csv", sep=""), header=T, row.names = 1)
Sys.time()
dim(raw.data)
raw.data[1:4,1:4]
head(colnames(raw.data)) 
# Load metadata 
metadata "Data_input/csv_files/S01_metacells.csv", sep=""), row.names=1, header=T)
head(metadata) 

# Find ERCC's, compute the percent ERCC, and drop them from the raw data.
erccs "^ERCC-", x = rownames(x = raw.data), value = TRUE)
percent.ercc fivenum(percent.ercc)
ercc.index "^ERCC-", x = rownames(x = raw.data), value = FALSE)
raw.data dim(raw.data) 

构建Seurat对象

有了表达矩阵,直接使用 CreateSeuratObject 函数即可,然后慢慢添加这个表达矩阵的一些其它外部属性,全部代码如下:


# Create the Seurat object with all the data (unfiltered)
main_tiss # add rownames to metadta 
row.names(metadata) # add metadata to Seurat object 
main_tiss main_tiss "percent.ercc")
# Head to check
head(main_tiss@meta.data)

# Calculate percent ribosomal genes and add to metadata
ribo.genes "^RP[SL][[:digit:]]", x = rownames(x = main_tiss@assays$RNA@data), value = TRUE)
percent.ribo fivenum(percent.ribo)
main_tiss "percent.ribo")
main_tiss

# Filter cells so that remaining cells have nGenes >= 500 and nReads >= 50000
main_tiss_filtered  50000 & nFeature_RNA > 500)
main_tiss_filtered

我们得到了main_tiss_filtered这个变量,是一个Seurat对象,就可以follow我们的教程后后续分析流程啦。参考代码仍然是是:

  • 祖传的单个10x样本的seurat标准代码
  • 祖传的单个10x样本的seurat标准代码(人和鼠需要区别对待)
  • seurat标准流程实例之2个10x样本的项目(GSE135927数据集)


如果你对单细胞转录组研究感兴趣,但又不知道如何入门,也许你可以关注一下下面的课程

  • 两年过去了,你们的单细胞文章终于发出来了

  • 生信爆款入门-第8期(线上直播4周,马拉松式陪伴,带你入门)你的生物信息入门课

  • 数据挖掘学习班第6期(线上直播3周,马拉松式陪伴,带你入门) 医学生/医生首选技能提高课

a9217b43d58ca49c38803c55ac4f29e6.gif

235f22b5e615c4adf549a5d954116dfb.png

看完记得顺手点个“在看”哦!

769f5ebc94c5d400551506a959b0f4f0.png生物 | 单细胞 | 转录组丨资料 每天都精彩

长按扫码可关注

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值