seqtk、seqtik常用功能
#fa和fq相互转换
seqtk seq test.fa -F "J" > test.fq
seqtk seq -A input.fastq > output.fasta
#滑动截取一定长度的序列 -s步长 -W窗口长度
seqkit sliding test.fa -s 1 -W 75 > test2.fa
#获得基因组长度
seqkit fx2tab -j 30 -l -n -i -H aim.fa
#输出如下
#id length
kraken:taxid|287|NZ_CP054791.1 6837408
kraken:taxid|287|NZ_CP028584.2 6886080
kraken:taxid|287|NZ_CP023316.1 6930893
#提取序列
seqtk subseq -l 40 B1_NR100nl.fasta name.list > out.fa
seqtk sample -s 20 taxid_fq/$1_10000.fq 10000 >> $1_out.fq #-s参数 seed随机种子;10000是目标reads数
#bedtools 提取序列
bedtools getfasta -fi input.fa -bed tmp.bed -fo out.fa
#拆分序列
awk '/^>/{s=++num}{print > "example_"s".fa"}' example.fasta
#fasta序列去重
#1.根据ID去重
seqkit rmdup -n test.fasta -o test.rmdup.fasta
#2.根据序列去重
seqkit rmdup -s test.fasta -o test.rmdup.fasta