20160420-序列比对前的准备工作

Hello,大家好!1周不见,甚是想念啊!


在之前的文章中,我们已经为大家介绍了高通量测序技术的原理,储存格式,使用FastQC做质量控制的方法。那么在使用FastQC之后,如果我们发现了一些问题(序列质量不高,),那么我们该使用什么样的工具,去解决这些问题呢?这就是今天我们要干的事情。

 

测试数据:

为了方便大家学习高通量测序分析,我为大家准备了一个测试数据,是双端测序的fastq文件,每个文件包含50W条reads。以后我们所有教程中展示的结果全部都来自于这1组测试数据。下载地址如下。

  • http://pan.baidu.com/s/1dEQsSnB  提取码7pmi 

fastx Toolkit

fastx Toolkit是包含处理fastq/fasta文件的一系列的工具,它是基于java开发的,我们高通量测序最常用到的是使用这个软件进行reads的裁剪(trim)。它的安装可以根据官网的指南进行:

  • http://hannonlab.cshl.edu/fastx_toolkit/index.html

在这里我们就不再赘述。下面我们对这个工具箱中的工具,具体的命令进行一个简要的介绍。


<p><strong>FASTQ-to-FASTA</strong></p><p>$fastq_to_fasta -h</p><p>使用形式:fastq_to_fasta [-h] [-r] [-n] [-v] [-z] [-i INFILE] [-o OUTFILE]</p><p>[-h] = 获得帮助信息.</p><p>[-r] = 使用序号去代替fastq文件中原来的reads名.</p><p>[-n] = 如果fastq中有N,保留.(默认是有N的序列删除)</p><p>[-v] = 报告reads的总数</p><p>[-z] = 调用GZip软件,输出的文件自动经过压缩.</p><p>[-i] = 输入文件,可以是fastq/fasta格式.</p><p>[-o] =输出路径,如果不设置会直接输出到屏幕.</p>

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值