(1)二代下机数据的初步处理

目录

一、利用Trimmomatic进行质量控制

二、用FastUniq去除PCR重复

前面还有fastqc碱基质控~

一、利用Trimmomatic进行质量控制

$ trimmomatic PE -threads 4 BJ_1.fq BJ_2.fq BJ_1.clear.fq BJ_1.unpaired.fq BJ_2.clear.fq BJ_2.unpaired.fq ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:50 TOPHRED33 

#利用Trimmomatic进行质量控制 
# 两个输入文件BJ_1.fq BJ_2.fq
# 四个输出文件BJ_1.clear.fq BJ_1.unpaired.fq BJ_2.clear.fq BJ_2.unpaired.fq
# PE/SE 设定针对Paired-End 或者Single-Endd reads进行处理  -threads 运行线程数  ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 切接头序列(哪里报错改哪里!!!)
# LEADING:3 切除reads开头质量值低于3的碱基  TRAILING:3 切除reads尾部质量值低于3的碱基
# SLIDINGWINDOW:4:15 从 reads 的 5' 端开始进行滑窗质量过滤,切掉碱基质量平均值低于阈值(15)的滑窗(4个碱基)#MINLEN:50 保留剪切后reads长度的最小值 
# 会产生很大的文件!!要注意

做完这个之后得到XX.clear.fq文件可以继续往下做~

二、用FastUniq去除PCR重复

如果fastqc结果没报这个的错,就不用画蛇添足哈~

#使用FastUniq去除Illumina paired reads 的PCR重复
$ mkdir -p FastUniq
$ cd FastUniq
$ ls ../Trimmomatic/illumina.?.fastq > illumina.list
#这是一个list,里面存放有测序文件的路径
$ fastuniq -i illumina.list -o illumina.1.fastq -p illumina.2.fastq

处理完数据,就可以去组装啦~

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值