单细胞10x的数据读取不进去怎么办?

面对越来越多的单细胞数据被上传至NCBI上,单细胞数据挖掘分析也逐渐走入大家的眼中。如何寻找一个合适的单细胞数据用于后续非常重要,这时候大家可能会经常遇到这么一个问题,一个标准的10x的数据,为什么我怎么也读取不进去呢?,这里我们以GSE163974数据为例。
首先,进入NCBI,下载该数据集https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi
在这里插入图片描述
下载之后解压
在这里插入图片描述一个
一个样本一个文件夹,如GSM4994385样本
在这里插入图片描述
修改文件名
在这里插入图片描述
这时候,打开Rstudio

#修改工作路径
setwd('C:\\Users\\aa\\Desktop\\10X')
options(stringsAsFactors = F)
#加载Rlibrary(Seurat)
library(dplyr)
library(ggplot2)
library(magrittr)
library(gtools)
library(stringr)
library(Matrix)
library(tidyverse)
library(patchwork)
library(data.table)
library(RColorBrewer)
library(ggpubr)
#读取数据,批量读取数据
dir_name=c('GSM4994385','GSM4994386')
datalist=list()
for (i in 1:length(dir_name)){
  dir.10x = paste0("GSE163974_RAW/",dir_name[i])
  my.data <- Read10X(data.dir = dir.10x) 
  datalist[[i]]=CreateSeuratObject(counts = my.data, project = dir_name[i], 
                                   min.cells = 3, min.features = 250)
}

在这里插入图片描述
这时候出现这样的报错,我们怎么处理呢?
这句话其实是告诉我们,我们的数据是有问题?
1、先解压表达谱,然后打开表达谱
在这里插入图片描述
修改成
在这里插入图片描述
使用7-zip反压回去
在这里插入图片描述
在这里插入图片描述
2、打开features文件,接着修改
在这里插入图片描述
添加一列
在这里插入图片描述
再反压回去,这时候在进行测试,只要报错就要修改,有的会提示你,barcodes最后一行无法识别,那就解压该文件直接打开删掉最后一行的空行。
在这里插入图片描述
#####################################################################
10x的数据相对来说还是比较规范的,如果遇到读不进去的时候,首先需要查看之前做过的10X的项目能不能读取进去,目的在于查看是否是环境不对导致的。
如果之前的可以,只有这套读取不见去,基本上可以认为是该数据有一定的问题,可以在进行修改,比对之前的文件,重新进行修正。
不同的R包版本,对于同一套数据可能是不一定的,可能在这套数据可以读取,下一套就不行的,这是因为不同版本的R对于10x数据格式要求的严格程度不同导致!
############新增,推荐一个在线分析的单细胞工具######
单细胞工具:http://www.sxdyc.com/singleCellTool
在这里插入图片描述

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值