1 简介
seqtk日常序列的处理包括,比如:fq转换为fa,格式化序列,截取序列,随机抽取序列等。
2 安装
# Sudo权限
sudo apt-get install seqtk
# 普通用户
git clone https://github.com/lh3/seqtk.git;cd seqtk; make
pwd
/public2/home/wu_yl/honghao/Biosofts/seqtk
echo 'export PATH=~/honghao/Biosofts/seqtk:$PATH'>>~/.bash_profile
source ~/.bash_profile
seqtk
3 使用
-A : 转化序列文件格式,如fastq转fasta
-l : 修改序列文件格式,如每行的碱基个数
-r : 序列反向互补
-C : 删除header上的注释信息
-N : 删除含有模糊碱基的序列
-U : 所有碱基大写
3.1 将 FASTQ 转换为 FASTA:
seqtk seq -a in.fq.gz > out.fa
3.2 序列反向互补
seqtk seq -r in.fq > out.fq