seqtk、seqtik常用功能

rxdddd

已于 2024-04-16 11:25:21 修改

阅读量403

点赞数 1

文章标签：服务器 linux

于 2024-04-16 11:22:05 首次发布

本文链接：https://blog.csdn.net/rxdddd/article/details/137818185

版权

seqtk、seqtik常用功能

#fa和fq相互转换
seqtk seq test.fa -F  "J" > test.fq
seqtk seq -A input.fastq  > output.fasta

#滑动截取一定长度的序列 -s步长 -W窗口长度
seqkit sliding test.fa -s 1 -W 75 > test2.fa

#获得基因组长度
seqkit fx2tab -j 30 -l  -n -i -H aim.fa
#输出如下
#id     length
kraken:taxid|287|NZ_CP054791.1  6837408
kraken:taxid|287|NZ_CP028584.2  6886080
kraken:taxid|287|NZ_CP023316.1  6930893

#提取序列
seqtk subseq -l 40 B1_NR100nl.fasta name.list > out.fa
seqtk sample -s 20 taxid_fq/$1_10000.fq 10000 >> $1_out.fq #-s参数 seed随机种子；10000是目标reads数

#bedtools 提取序列
bedtools getfasta -fi input.fa -bed tmp.bed -fo out.fa

#拆分序列
awk '/^>/{s=++num}{print > "example_"s".fa"}' example.fasta

#fasta序列去重
#1.根据ID去重
seqkit rmdup -n test.fasta -o test.rmdup.fasta
#2.根据序列去重
seqkit rmdup -s test.fasta -o test.rmdup.fasta