eggNOG-mapper
1. 提交分析
2. 结果分析
out.emapper.annotations.xlsx文件
out.emapper.annotations.xlsx 结果解读
- query:蛋白序列名称
- seed_ortholog:搜索阶段比对上的seed ortholog编号
- evalue:evalue值,越小结果越可靠
- score:比对的得分,越大越可靠
- eggNOG_OGs:为序列确定的以逗号分隔、按照进化分支深度排序的直系同源组(orthologs groups,OGs)列表。每个直系同源组以OG@tax_id|tax_name方式展现。
- max_annot_lvl:用于检索注释的最宽的直系同源组,以tax_id|tax_name方式展现。
- COG_category:从最佳OG中推测的COG功能分类(一个字母),具体有哪些可以看这里NCBI的介绍COG - NCBI (nih.gov)。
- Description:注释的基因功能描述(eggNOG-mapper注释的描述真的很简短……)
- Preferred_name:普遍使用的基因名缩写
- GOs:注释的GO编号,一个基因可能对映非常多的GO号
- EC:KEGG的EC通路编号,代表相关的酶
- KEGG_ko:KEGG的KO编号,表示直系同源基因,代表一个具体的功能
- KEGG_Pathway:通常有ko编号和map编号,map编号代表reference pathway,是一种代谢通路类型,比较具体有一般参考意义
- KEGG_Module:KEGG Module数据库编号,以M开头,实际上就是多个KO划分在一个共同发挥功能的单元里
- KEGG_Reaction:KEGG Reaction数据库编号,以R开头,包含代谢通路上酶促反应相关信息
- KEGG_rclass:KEGG RCLASS数据库编号,以RC编号开头,手动整理的反应数据集合
- BRITE:KEGG的Brite数据库编号,用的不是很多,是一个储存分类信息的数据库
- CAZy:碳水化合物酶相关的专业数据库,可以看官网CAZy - Home
- BiGG_Reaction:BiGG是一个整合基因组尺度代谢网络模型的数据库,官网BiGG Models (ucsd.edu)
- PFAMs:PFAM数据库,根据多序列比对结果和隐马尔可夫模型,将蛋白分为不同家族的一个数据库,官网InterPro (ebi.ac.uk)。没错官网是InterPro,pfam数据库已经被InterPro合并,并且2023年1月之后原网页就失效了。
eggNOG-mapper Helper:一键直接整理 eggNOG-mapper 的结果
out.emapper.annotations.description.txt,对应的功能文本描述
out.emapper.annotations.GO.txt,对应的是GO注释结果,可直接用于 TBtools GO富集分析,当注释背景文件
out.emapper.annotations.KEGG_Knum.txt,对应的是KEGG注释结果,可直接用于 TBtools KEGG富集分析,当背景注释文件
out.emapper.annotations.pfam.domain.txt,对应的是PFAM结构域注释,注意,这个注释结果是定性的,即有无某结构域,如果一个序列有多个相同结构域,只会显示一个