目的与任务:了解fastq测序数据
需要用安装好的sratoolkit把上一节中下载好的SRA文件转换为fastq格式的测序文件,并且用fastqc软件检查测序文件的质量!
作业:理解测序reads,GC含量,质量值,接头,index,fastqc的全部报告,搜索中文教程,并发在论坛上面
SRA文件转换为fastq文件
用sratoolkit将NCBI上下载的sra文件转换成fastq文件,以便进行下一步的QC。该工具的安装与介绍在转录组入门1中已经有所介绍。这里我再回顾一下sratoolkit的使用:
2.查看本地帮助
从打开的页面中我们能大概了解到fastq-dump命令的基本用法。然后我在本地的CentOS上又运行了帮助命令来查看本地版的命令说明。
fastq-dump -h #显示帮助
显然,本地的帮助说明更详细一点。
先看用法:“fastq-dump [各种参数] ”其中,[各种参数]在帮助中有详细介绍,根据博主@徐洲更以及@沈梦圆的文章介绍,我们常用到的参数主要是以下两部分的:
*关于输出:
-O 指定输出路径
--gzip 指定输出格式为gzip压缩格式(fastqc软件可以直接识别gzip压缩的文件)
--bzip2 指定输出格式为bzip2压缩格式
*多个文件参数
--split-3 如果是双端测序数据,则输出两个文件,如果不是则只输