bed文件格式:
bed文件是一种常用的基因组注释文件格式,用于描述基因组上的区域。它由三列或更多列组成,分别表示染色体名称、区域起始位置和区域终止位置,以及可选的其他信息。
提取上下游150bp序列:
seqkit subseq --bed 39.bed -u 150 -d 150 -o pro.fa genome.v1.0.fa
seqkit subseq --bed test.bed -u 150 -d 150 -o test.fa XXX.genome.chromosome.fasta
#参数解释
-d, --down-stream int down stream length #指定下游的长度
-u, --up-stream int up stream length #指定上游的长度
重命名:
mv 文件1 命名2