欢迎关注”生信修炼手册”!
直系同源蛋白的预测在系统发育,比较基因组学等多个领域都占用重要地位,COG数据库开创了同源蛋白数据库的先河,后续又不断有新的数据库涌现,而eggNOG就是目前使用最广泛的数据库之一。
官网如下
http://eggnogdb.embl.de/#/app/home
eggNOG全称evolutionary genealogy of genes:Non-supervised Orthologous, 在COG算法的基础上进行了拓展和延伸,采用基于图状结构的非监督聚类算法,构建了真核,原核,病毒等不同物种的同源蛋白簇。
该数据库最新版本为eggNOG 4.5.1, 涵盖了2031种真核和原核生物,352种病毒,构建了19万个同源蛋白簇。
和COG类似,eggNOG对于orthology group的功能也进行了分类整理,每个类别用一个字母表示,在以下链接可以查看具体的分类信息
http://eggnogdb.embl.de/download/eggnog_4.5/COG_functional_categories.txt
COG数据库中提供了26种分类,eggNOG中提供了25种分类,缺少了如下类别
X Mobilome: prophages, transposons
其他的分类和COG数据库完全一致。在官网的搜索框中可以对OG编号进行检索