FastQC ——Quality control before sequence alignment软件安装(linux)Fastqc
raw data的质量控制,为了识别及去除测序流程中各种原因导致的低质量的碱基及污染序列等。*方法仅适用于base-space数据
软件安装(linux)
[FastQC]
$ java -version # fastqc和trimmomatic均需Java运行环境$ sudo apt install openjdk-14-jre-headless # 若没有安装尝试这个安装命令$ tar -zxvf jdk-14.0.1_linux-x64_bin.tar.gz # 解压到当前目录$ wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip # 下载fastqc$ unzip fastqc_v0.11.9.zip # 解压$ cd FastQC/ # 切换到fastqc目录下$ chmod 755 fastqc # 设置权限 属主可读、写、执行,其他用户读、执行
[Trimmomatic]
$ wget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.39.zip # 下载$ unzip Trimmomatic-0.39.zip # 解压
Fastqc
1.Function: 一款用于高通量测序原始数据质量控制的工具软件,以期提示原始数据可能存在的问题或偏向。
2.Brief introduction: 由Java语言编写,运行稳定,代码成熟,遵循GPLv3及之后版本的开源协定。
支持BAM、SAM、Fastq(CASAVA, colorspace, etc)文件格式输入,可输出为HTML。
每个输出模块都有相应的图示和结果提示
FastQC不仅可以提示测序仪以及测序过程中的误差,还能提示在文库构建中可能引入的误差。
交互模式——少量的快速数据分析;非交互模式——大量数据分析。
3.基本使用操作:(非交互模式下)
如果输入文件为空,那么程序就会自动打开交互式的图形界面
基本语句:fastqc -o [--(no)extract] [-f fastq|sam|bam] [-c contaminant files] seqfile1 seqfile2 ... seqfileN
-o
: