目录
前面还有fastqc碱基质控~
一、利用Trimmomatic进行质量控制
$ trimmomatic PE -threads 4 BJ_1.fq BJ_2.fq BJ_1.clear.fq BJ_1.unpaired.fq BJ_2.clear.fq BJ_2.unpaired.fq ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:50 TOPHRED33
#利用Trimmomatic进行质量控制
# 两个输入文件BJ_1.fq BJ_2.fq
# 四个输出文件BJ_1.clear.fq BJ_1.unpaired.fq BJ_2.clear.fq BJ_2.unpaired.fq
# PE/SE 设定针对Paired-End 或者Single-Endd reads进行处理 -threads 运行线程数 ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 切接头序列(哪里报错改哪里!!!)
# LEADING:3 切除reads开头质量值低于3的碱基 TRAILING:3 切除reads尾部质量值低于3的碱基
# SLIDINGWINDOW:4:15 从 reads 的 5' 端开始进行滑窗质量过滤,切掉碱基质量平均值低于阈值(15)的滑窗(4个碱基)#MINLEN:50 保留剪切后reads长度的最小值
# 会产生很大的文件!!要注意
做完这个之后得到XX.clear.fq文件可以继续往下做~
二、用FastUniq去除PCR重复
如果fastqc结果没报这个的错,就不用画蛇添足哈~
#使用FastUniq去除Illumina paired reads 的PCR重复
$ mkdir -p FastUniq
$ cd FastUniq
$ ls ../Trimmomatic/illumina.?.fastq > illumina.list
#这是一个list,里面存放有测序文件的路径
$ fastuniq -i illumina.list -o illumina.1.fastq -p illumina.2.fastq
处理完数据,就可以去组装啦~