单细胞测序数据分析(2)- cell ranger使用前注意事项-学习笔记

这篇博客介绍了单细胞测序数据分析中cell ranger软件使用前的注意事项,包括sratoolkit的fastq-dump参数解释,如-gzip、--split-3和-A的用途。内容还涉及到fastq文件的拆分,解释了Read1、Read2和Read3的测序内容,强调了I7 sample index在细胞识别中的作用。博主分享了将SRA文件转换为fastq格式并进行质控的过程,为后续分析做好准备。
摘要由CSDN通过智能技术生成

参考网站:
单细胞实战(二) cell ranger使用前注意事项

下载好了数据,就要进行拆分了。
首先需要的是一个软件,sratoolkit .
在第一节的数据下载里就提及到要用的 fastq-damp,。

fastq-dump --gzip --split-files  SRR7722937.sra   

其中主要使用了三个参数:
–gzip:将生成的结果fastq文件进行压缩
–split-3:其实有点复杂:首先它是分割的意思,-3实际上指的是分成3个文件,它诞生的时间比较早,是在1000 Genome的Phase1阶段产生的。如果结果发现只有一个文件,说明数据不是双端(第三个文件太大会覆盖前两个);如果结果有两个文件,说明是双端文件并且数据质量比较高(没有低质量的reads或者长度小于20bp的reads);如果结果有三个文件,说明是双端文件,但是有的数据质量不高,存在trim的结果,第三个文件的名字一般是:<srr_id>.fastq, 而且文件也不大,基本可以忽略
-A:指定输出的文件名

 解压完会有三个文件,查看一下里面都是啥:
 zless -SN SRR7722937_1.fastq.gz | head     
 zless -SN SRR7722937_2.fastq.gz | head  
zless -SN SRR7722937_3.fastq.gz | head  

  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值