生信软件 | Trimmomati （质量控制，修剪低质和接头序列）

最新推荐文章于 2024-10-10 07:08:23 发布

白墨石

最新推荐文章于 2024-10-10 07:08:23 发布

阅读量5.7k

点赞数 6

分类专栏： # 生信分析文章标签：生物信息 Trimmomati

本文链接：https://blog.csdn.net/u011262253/article/details/88828987

版权

生信分析专栏收录该内容

57 篇文章 141 订阅

订阅专栏

文章目录

介绍

Trimmomati 用于去除 Illumina平台的FASTQ序列中的Adapter，根据碱基质量值修整FASTQ序列文件
支持单末端（SE），双末端（PE）测序数据
支持多线程，gzip，bzip2压缩的FASTQ文件
支持phred-33 和 phred-64 格式互相转化，目前多数Illumina测序数据为phred-33格式

安装

conda install -c trimmomati

这里需要安装Conda (一款用于安装多数生物信息分析软件的管理软件，重要的是可以解决软件的依赖问题) ： Conda 安装使用图文详解

使用

单末端测序数据

trimmomatic SE -phred33 input.fq.gz output.fq.gz ILLUMINACLIP:TruSeq3-SE:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

双末端测序数据

trimmomatic PE -phred33 input_forward.fq.gz input_reverse.fq.gz output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

常用参数：

-threads 线程数，最大是CPU核数

-trimlog 生成日志名，强烈建议不开这个参数，生成的log文件巨大且大多数情况下，你是不会看的

-quiet 静默模式

与其他软件命令不同，Trimmomatic提供了多种修整步骤：

ILLUMINACLIP：从reads中剪切adapter和其他Illumina特定序列。
SLIDINGWINDOW：执行滑动窗口修剪，一旦窗口内的平均质量低于阈值，则切割。
LEADING：如果低于阈值质量，则在reads起始处剪切碱基
TRAILING：如果低于阈值质量，则在reads末尾处剪切碱基
CROP：将reads从末尾切割为指定长度
HEADCROP：从reads剪切后低于指定长度，则删除
MINLEN：如果reads低于指定长度，则删除
TOPHRED33：将质量得分转换为Phred-33
TOPHRED64：将质量得分转换为Phred-64

文档：http://www.usadellab.org/cms/index.php?page=trimmomatic

双末端测序命令解释

PE模式中，输入文件有两个input_forward.fq.gz input_reverse.fq.gz输出文件有四个（output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz），其中过滤之后双末端序列都保留的是paired,只保留一端序列的就是unpaired

mark