如何下载NCBI上的10X单细胞测序原始数据并用于Cell Ranger分析

本文介绍了如何从NCBI的SequenceReadArchive(SRA)获取10xGenomics的单细胞测序数据,包括使用fastq-dump下载SRR文件,识别并转换文件命名,以满足CellRanger的处理要求。
摘要由CSDN通过智能技术生成

1. 获取数据的SRR*

根据参考文献提供的GEO数据链接,直接在浏览器打开,或者NCBI官网检索GSE号,在数据网址的最下方点击SRA Run Selector链接跳转至新的页面,该页面包含原始fastq文件的SRR编号,和样本的一些基本信息。

2. 使用fastq-dump下载数据

以SRR9264343为例

fastq-dump --split-files --gzip SRR9264343

下载完成后有以下三个文件,Cell Ranger mkfastq处理之后,一般会产生3个fastq.gz文件,分别是I1文件,8bp的样本barcodes;R1文件16bp feature barcodes + 10 bp/12 bp UMI; R2文件转录组的reads文件。

从SRA Run Selector页面,单击单个样本的SRR*,可以跳转至以下页面并点击Data access,根据Original format处的信息,可以清晰地分辨下载后3个的文件分别对应的具体文件。

3. 下载文件修改命名

Cell Ranger 要求fastq文件的命名符合 bcl2fastq文件的命名规范,即以下模式:

[Sample Name]_S1_L00[Lane Number]_[Read Type]_001.fastq.gz

修改文件名,使其符合规范。或者直接将上面original format信息中Name列文件名修拷贝过去,修改后的文件名如下:

参考网址

https://kb.10xgenomics.com/hc/en-us/articles/115003802691-How-do-I-prepare-Sequence-Read-Archive-SRA-data-from-NCBI-for-Cell-Ranger

understand 10x scRNAseq and scATAC fastqs | DNA confesses Data speak

  • 6
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在R语言中,对单细胞数据进行注释可以使用许多不同的包和方法。以下是一些常用的注释方法: 1. 使用SingleR包:SingleR包是一个用于单细胞RNA测序数据注释的软件包。它通过将单细胞数据与基准参考数据进行比较,来预测每个单细胞样本的细胞类型。你可以使用SingleR包中的`SingleR`函数来进行注释。首先,你需要准备一个基准参考数据集,然后使用`SingleR`函数将单细胞数据与该参考数据集进行比较。 2. 使用scmap包:scmap包是另一个用于单细胞数据注释的软件包。它也是通过将单细胞数据与参考数据进行比较来预测每个单细胞样本的细胞类型。你可以使用scmap包中的`scmapCluster`函数来进行注释。首先,你需要准备一个参考数据集,然后使用`scmapCluster`函数将单细胞数据映射到参考数据集上。 3. 使用SingleCellExperiment包:SingleCellExperiment包是一个用于存储和分析单细胞RNA测序数据的通用框架。你可以使用该包中提供的方法来进行单细胞数据的注释。例如,你可以使用`reducedDims`函数对单细胞数据进行降维,然后使用`cluster`函数对降维后的数据进行聚类,最后使用`annotate`函数将聚类结果注释为细胞类型。 这些是一些常用的单细胞数据注释方法,你可以根据具体的需求选择合适的方法进行注释。当然,还有其他的包和方法可供选择,具体选择哪个方法取决于你的数据和研究问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值