fastx_toolkit去除测序数据中的接头和低质量的reads

博客介绍了如何使用fastx_toolkit去除高通量测序数据中的接头和低质量reads。通过fastx_clipper进行接头序列修剪,设置合适的参数如接头序列、忽略长度等。接着使用fastq_quality_filter过滤低质量序列,依据质量值和比例设定阈值。这两个步骤有助于提高后续数据分析的准确性和效率。
摘要由CSDN通过智能技术生成

高通量测序数据下机后得到了fastq的raw_data,通常测序公司在将数据返还给客户之前会做“clean”处理,即得到clean_data。然而,这些clean_data是否真的“clean”呢?
首先,我们应该做一下质控。如果质控不合格,就需要一些处理,比如去接头、去除量的reads。

(1)去除测序数据中的接头(用到的是fastx_toolkit里面的fastx_clipper工具):
 

Usage: fastx_clipper [-h] [-a ADAPTER] [-D] [-l N] [-n] [-d N] [-c] [-C] [-o] [-v] [-z] [-i INFILE] [-o OUTFILE]  #去掉接头序列

 [-a ADAPTER] =接头序列(默认为CCTTAAGG)

 [-l N]       = 忽略那些碱基数目少于N的reads,默认为5

 [-d N]       = 保留接头序列后的N个碱基默认  -d 0

 [-c]         = 放弃那些没有接头的序列.

 [-C]         = 只保留没有接头的序列.

 [-k]         = 报告只有接头的序列.

 [-n]         = 保留有N多序列,默认不保留

 [-v]         =详细-报告序列编号

 [-z]         =压缩输出.

 [-D]       = 输出调试结果.

 [-M N]   =要求最小能匹配到接头的长度N,如果和接头匹配的长度小于N不修剪

 

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值