单细胞 | Seurat文件生成

最近想使用文献中的数据集,发现每篇文献提供的数据格式都不太一样,创建seurat对象会遇到一些问题。

以标准的输入文件为例,命名为barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz,分别是细胞标签,基因,表达矩阵,但是文章提供的数据可能并不是标准格式,需要打开文件确认。

以SCP1852数据为例,发现有四个文件:

AllNuclei_snRNA_counts.mtx.gz打开是表达矩阵(即matrix.mtx.gz),三列分别为基因、细胞、表达量。

 AllNuclei_snRNA_counts_colnames.txt.gz打开是细胞信息(即barcodes.tsv.gz)

 

AllNuclei_snRNA_counts_rownames.txt.gz打开是基因信息(即features.tsv.gz),标准的features文件是两列,包括ensemble ID和symbol,这里只有一列,最简单的方法就是复制一下,变成两列,不然后面用Read10X读取文件会显示报错error in [.data.frame(category.matrix, , gene.group, drop = f) : undefined columns selected。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值