欢迎关注”生信修炼手册”!
为了研究不同物种间保守的蛋白功能,进一步揭示其进化关系,1997年的时候科学家选取了七个完整基因组的蛋白序列,根据序列和功能相似性,将这些蛋白进行了分类。这个分类叫做cluster of orthologous group,简称COG。每个COG是一组同源蛋白的集合,具有相同的生物学功能。 官网如下
https://www.ncbi.nlm.nih.gov/COG/
构建原始的COG使用的蛋白序列来自以下7个物种
E.coli
H.influenzae
M. genitalium
M. pneumoniae
Synechocystis sp.
M. jannaschii
S. cerevisiae
可以发现,这些物种都是细菌。所以COG这个概念指的是细菌中的同源蛋白。
随着测序技术的发展,越来越多的物种拥有了完整的基因组序列。2003年的时候,又根据66个细菌物种的蛋白序列,对之前的COG结果进行了补充和拓展。
同时将orthologous group 的概念推广到了真核生物中,根据7个真核生物的蛋白序列构建了真核生物中的同源蛋白簇, 全称为eukaryotic orthologous groups, 简称KOG。
之后又陆续在不同类型的物种中建立起相关的同源蛋白簇。古菌中的同源蛋白簇简称为arCOG, 噬菌体中的同源蛋白簇简称为POG,感染真核生物的病毒中的同源蛋白簇简称为NCVOG,巨型病毒的同源蛋白簇简称为mimiCOG。
在官网上&