Outline
前言
之前做质控的大致流程是先用fastqc看一下测序质量,随后会使用去接头和低质量软件去去除adapter以及低质量序列,如常用的cutadapt、trimmomatic、以及之前有所了解的国产软件fastp。最近新接触的一款软件Trim Galore,有所耳闻,但还未使用过,这次接着分析bulk-RNA的机会,再系统回顾一下这些上游处理的软件。
提示:以下是本篇文章正文内容,下面案例可供参考
1. Trim Galore可以用来做什么?(What?)
Trim Galore封装了fastqc和cutadapt这两款软件,也就是说它将查看fastq质量和去除fastq低质量序列这两步封装在了一起,此外,它除了处理高通量测序数据外,很神奇的是它还可以处理RRBS(Reduced Representation Bisulfite-Seq )这种DNA甲基化序列。
2. Trim Galore的优势(Why trim galore?)
- 方便:包装了fastqc和cutadapt,一个软件就可以完成两个软件做的事情
- 使用广泛:除了像cutadapt和timmomatic一样可以处理高通量测序数据外,还可以处理RRBS(为什么可以处理RRBS?那为什么处理不了全基因组甲基化数据呢?)
3. 处理思路(How?)
Step1:Quality Trimming
从3’去除低质量序列
Step2:Adapter Trimming
自动识别并去除adapter
- Adapter auto-detection
- Manual adapter sequence specification
Step3:Removing Short Sequences
当去除3’的低质量序列和adapter后,最后剩下来的序列会比较短,这对于后续的比对是不利的,会影响比对率,所以需要去除过短的序列。
Step4:Specialised Trimming
个性化使用(这次不用就先不看了哈)