1.sra文件转换为fastq格式
为了进行测序数据质量检查我们需要将下载好的sra数据转换为fastq格式:使用Sratoolkits中的fastq-dump命令进行格式转换
Sratoolkits的官方文档中有fastq-dump命令的介绍(https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=fastq-dump),fastq-dump的用法是fastq-dump [各种参数] <输入文件的路径>
- 主要会用到的参数有:
-O 指定输出路径
–gzip 指定输出格式为gzip压缩格式(fastqc软件可以直接识别gzip压缩的文件)
–bzip2 指定输出格式为bzip2压缩格式 (bzip格式较之gzip格式压缩效率更高,但是速度较慢)
多个文件参数
–split-3 如果是双端测序数据,则输出两个文件,如果不是则只输出一个文件。