gffutils 是一个用来解析 gff 文件的 Python 包,可以十分方便地获取 gff 文件中的相关信息。gggenes 是 ggplot2 的扩展包,用于绘制基因结构图、多物种基因比较图的很好玩的工具。两个工具联用可以实现从 gff 数据获取到基因结构图绘制的全过程。
对 gff 原始数据进行处理
安装 gffutils
使用 conda 或者 pip 进行安装。
conda install gffutils
pip install gffutils
gff 文件预处理
对 gff 文件进行预处理,截取包含所需基因的 gff 内容。建议在 Linux 中使用 sed 命令完成。如果进行比较基因组工作,需要将各基因组数据合并到一个 gff 文件中。
程序调用
下载 gff2gggenes.py 到本地。
Windows 中利用 powershell 调用程序:
python .\gff2gggenes.py example.gff
python .\gff2gggenes.py example.gff sub
Linux 中利用 console 调用程序:
python ./gff2gggenes.py example.gff
python ./gff2gggenes.py example.gff sub
根据安装 Python 的版本不同,可能需要将“python”替换为“python3”。
不添加 sub 参数,表示只将各基因的情况进行输出;添加 sub 参数,表示同时输出各基因子区域(例如:mRNA、CDS等,与 gff 文件内容有关)。
结果输出
界面显示“完成”表示程序运行成功。