COG注释分析图解

COG注释分析图解

COG数据库简介
COG(Clusters of Orthologous Groups )注释是差异基因功能注释的一种方法。COG是由NCBI创建并维护的蛋白数据库,是对基因产物进行同源分类,较早的识别直系同源基因的数据库,通过对多种生物的蛋白质序列大量比较而来。COG分为两类,一类是原核生物的,另一类是真核生物。原核生物的一般称为COG数据库;真核生物的一般称为KOG数据库。通过比对可以将某个蛋白序列注释到某一个COG中,每一簇COG由直系同源序列构成,从而可以推测该序列的功能。COG数据库按照功能一共可以分为二十六类。

应用
在生物学研究中,通过序列分析,识别到差异表达基因之后,根据基因的功能注释(通常是基于GO、COG和KEGG数据库。),以评估基因的不同表达对生物学功能的影响,最终找到分子靶标。COG注释的作用:首先,通过已知蛋白对未知序列进行功能注释;其次, 通过查看指定的COG编号对应的protein数目,存在及缺失,从而推导特定的代谢途径是否存在; 最后,每个COG编号代表一类蛋白,将query序列和比对上的COG编号的proteins进行多序列比对,能确定保守位点,分析其进化关系。

图示

差异表达基因COG 富集条目图在这里插入图片描述在这里插入图片描述

图解:不同颜色代表不同 COG term, 饼图面积代表注释到此term的差异表达基因数量比例。

  • 2
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
是的,您说得对。emapper.annotations是eggnog-mapper的主要输出文件之一,包含了输入序列的各种注释信息和统计数据。具体来说,每行代表一个输入基因或蛋白质,列包括以下内容: 1. **query_name**:输入序列的ID。 2. **seed_eggNOG_ortholog**:输入序列的Seed Ortholog的EGGNOG Ortholog Group ID。 3. **seed_ortholog_evalue**:输入序列和Seed Ortholog的比对E-value。 4. **seed_ortholog_score**:输入序列和Seed Ortholog的比对Bit-Score。 5. **Predicted_gene_name**:预测的基因名称。 6. **GO_terms**:Gene Ontology (GO) ID和term。 7. **KO**:KEGG Orthology (KO) ID。 8. **KEGG_Pathway**:预测的KEGG Pathway ID和描述。 9. **KEGG_Module**:预测的KEGG Module ID和描述。 10. **KEGG_Reaction**:预测的KEGG Reaction ID和描述。 11. **KEGG_rclass**:预测的KEGG Reaction Class。 12. **BRITE_hierarchy**:预测的BRITE hierarchy。 13. **COG**:Clusters of Orthologous Groups (COG) ID和描述。 14. **eggNOG_ortholog_groups**:输入序列的所有EGGNOG Ortholog Group ID。 15. **best_eggNOG_ortholog_evalue**:输入序列和最佳EGGNOG Ortholog的比对E-value。 16. **best_eggNOG_ortholog_score**:输入序列和最佳EGGNOG Ortholog的比对Bit-Score。 17. **Predicted_taxonomic_group**:预测的序列所属的分类群。 18. **Predicted_protein_name**:预测的蛋白质名称。 19. **COG_cat**:COG分类。 这些注释信息和统计数据可以用于进一步的生物信息学分析和可视化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值