质量评估包括
- 对下机的原始数据fastq进行质控
- 对比对后的bam文件进行质控
一. fastq质控
常用工具:
- fastqc:只评估原始数据,不对原数据进行过滤
- fastp:可以执行数据过滤和修建
1.fastqc的使用
fastqc -t 12 -o outputdir/ sample_1.fq.gz sample_2.fq.gz #双端测序
-t 线程数12 -o 定义输出目录
2.fastqc的输出
输出文件包括zip压缩文件和网页格式的文件,html格式的文件便于在本都网页端可视化
- summary.txt 对输入的测序质量评估
有ERROR的时候需要注意测序的质量是否合格,WARN一般影响不大,但还是需要查看具体情况,可能会影响后续的变异分析
- fastqc_data.txt :summary.txt指标中的详细信息
二. Fastp的使用
fastp的功能包括:去掉低质量的碱基、去除接头等
具体使用可以参考: 使用fastp进行数据质控
三.其它工具
Trimmomatic、Cutadapt:可以去除接头