cellranger-atac 操作笔记-2:映射单细胞ATAC数据

本文介绍了cellranger-atac的输入测序文件命名规则,遵循与cellranger分析相同的标准,涉及R1, R2, R3和I1等文件类型。文章还列举了重要参数,如--id, --reference, --fastqs和--sample,并展示了如何运行分析命令。此外,提到一个25G数据量的分析大约需要24小时,并指出主要结果保存在outs目录下。
摘要由CSDN通过智能技术生成

1. cellranger-atac 输入测序文件命名规则参考cellranger 分析数据命名规则,两者一致。

       cellranger 分析数据命名规则_韩建刚(CAAS-UCD)的博客-CSDN博客

一个样本名文件夹包含所有该样本的测序数据,单个lane或多个lane,多个样本名文件夹放在同一个文件夹下。如下:是两个lane对同一样本的测序数据,放在同一个以样本名为前缀的文件夹下,R1,R2,R3,I1分别代表read 1,barcode,read 2 和 sample index。这些分别代表什么可以详细的阅读10X ATAC文库构建流程。

tree 201858A_samplename_A

201858A_samplename_A/
├── 201858A_samplename_A_S2_L001_I1_001.fastq.gz
├── 201858A_samplename_A_S2_L001_R1_001.fastq.gz
├── 201858A_samplename_A_S2_L001_R2_001.fastq.gz
├── 201858A_samplename_A_S2_L001_R3_001.fastq.gz
├── 201858A_samplename_A_S5_L001_I1_001.fastq.gz
├── 201858A_samplename_A_S5_L001_R1_001.fastq.gz
├── 201858A_samplename_A_S5_L001_R2_001.fastq.gz
└── 201858A_samplename_A_S5_L001_R3_001.fastq.gz

0 directories, 8 files

2. 几个重要参数

--id=ID	# 输出文件名
--reference=PATH # 参考基因组文件夹路径	
--fastqs # 测序数据文件路径
--sample # 指定要分析的样品

3. 将ATAC数据比对到参考基因组,依据数据量大小,运行时间不等,25G数据量运行了24h左右,如果运行速度慢,时间会更长

cellranger-atac count --id=output_name \
                        --reference=/path/to/reference/folder \
                        --fastqs=/path/to/seq_data/folder \
                        --sample=mysample \
                        --localcores=8 \
                        --localmem=64

4. 输出文件,主要结果保存在outs中,输出文件内容在下一篇博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值