今天在NCBI下载了酵母的参考基因组,没有找到gff格式的基因组注释文件,只找到了genbank格式的基因组注释文件。应该会有现成的工具来实现常用的基因组注释文件不同格式之间的相互转换。比如gtf、gff、和genbank之间的相互转换。
经过搜索找到三款工具可以把gb格式文件转换成gff格式注释文件。
第一个是 EMBOSS工具中的seqret命令
参考
https://www.biostars.org/p/140013/
使用conda安装EMBOSS
conda install emboss
seqret命令转化
seqret -feature -osformat2 gff3 -outseq chr01.gff chr01.gb
第二个工具是 jvarkit
参考链接
http://lindenb.github.io/jvarkit/GenbankToGff3.html
这是一个java程序 我没有安装成功
最开始服务器上没有安装java,