零代码利用KofamKOALA进行在线版蛋白KEGG注释
目前分析的主要方案都是利用eggNOG-mapper(我们也是使用这个分析),对基因组蛋白文件进行同源比对,随后调用eggNOG收录的KEGG注释。对拥有注释的蛋白取交集(29296)和并集(45599)发现两者具有较高的重叠,但也有一定的独特注释(加上KofamKOALA,相比单纯的eggNOG-mapper注释多了5k)。两个数据库绝大多数蛋白都享有相同的k号,但也有少部分蛋白的注释不太一致(见红框),推测可能与数据库收录情况有关,鉴于这两者都是常用且被认可的数据库,私认为可以考虑并集整合。
原创
2024-05-10 14:54:13 ·
487 阅读 ·
0 评论