最近分析转录组数据,自己倒腾着做KEGG pathway的富集分析(许多转录组文章都是用KOBAS数据库
http://kobas.cbi.pku.edu.cn/home.do
来做KEGG pathway的富集分析,但是该网站只能一次提交500条序列,如果差异表达基因超过500条就不能用该网站进行分析了)。
得到了差异表达基因的gi号,如何快速将gi号映射为ko号是进行富集分析必须解决的问题。
目前发现有几种方法可以解决(可能还有其他方法)。
方法一:根据KEGG API(
http://www.kegg.jp/kegg/docs/keggapi.html
),利用如下脚本完成:
#!/usr/bin/perl
use strict;
use warnings;
use L