列注释_使用eggnog-mapper进行功能注释

本文介绍了如何使用eggnog-mapper V2进行非模式生物的功能注释,作为blast2go的免费替代方案。文章详细阐述了数据库的下载、解压和安装过程,以及使用DIAMOND进行序列比对的参数设置。注释完成后,解释了emapper.annotations文件的22列信息,为读者提供了提取所需数据的参考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

欢迎关注微信公众号"生信小王子"!

对于许多做非模式生物的同学来说,没有现成的功能注释可用是非常难受的一件事。而blast2go虽然可以一步到位帮你完成功能注释,但它是收费的。这时,我们可以使用eggnog-mapper进行功能注释。

eggnog-mapper现在已经更新到了V2版本,需要在Python2.7环境下运行,并保证有超过40G的存储空间存放数据库。

## 下载eggnog-mapper V2版本
git clone https://github.com/eggnogdb/eggnog-mapper.git

目前,eggNOG数据库已经更新到了5.0版本,收集了更为全面的物种和更多的蛋白序列信息,在进行注释前我们需要先把数据库下载下来。

## 下载
python ./download_eggnog_data.py

直接使用命令下载数据库的话速度非常慢,我们可以使用迅雷或者其他工具下载。
下载地址分别为:
http://eggnogdb.embl.de/download/emapperdb-5.0.0/eggnog.db.gz

http://eggnogdb.embl.de/download/emapperdb-5.0.0/eggnog_proteins.dmnd.gz

下载好后移至eggnog-mapper安装目录的data文件夹下并解压。

c834942cb8b60b7577e0bf6484b61612.png

解压好之后就可以进行功能注释了。

## 功能注释
python emapper.py -i pep.fa --output out -m diamond --cpu 12

-i:输入蛋白序列。

--output:输出文件前缀。

-m diamond:使用DIAMOND进行序列比对。

--cpu:使用的线程数。

使用DIAMOND进行比对的速度非常快。30万条序列用12个线程注释花了5个多小时。

注释完成后会输出两个文件,emapper.annotations为后缀的文件记录了注释结果。文件一共有22列:

1. query_name 输入的ID
2. seed eggNOG ortholog 在eggNOG中比对到的最佳结果
3. seed ortholog evalue
4. seed ortholog score
5. Predicted taxonomic group
6. Predicted protein name 预测得到的蛋白名
7. Gene Ontology terms 注释到的GO terms
8. EC number
9. KEGG_ko 注释到的ko
10. KEGG_Pathway 注释到的通路
11. KEGG_Module
12. KEGG_Reaction
13. KEGG_rclass
14. BRITE
15. KEGG_TC
16. CAZy
17. BiGG Reaction
18. tax_scope: eggNOG taxonomic level used for annotation
19. eggNOG OGs
20. bestOG (deprecated, use smallest from eggnog OGs)
21. COG Functional Category
22. eggNOG free text description

大家可以根据自己的需求提取对应的信息。

参考资料:

https://github.com/eggnogdb/eggnog-mapper/wiki/eggNOG-mapper-v2

https://www.jianshu.com/p/e646c0fa6443

2677ea5f66cadca9fd7dc462eee309cf.png
This third edition represents another major upgrade to this classic networking book. The field continues to change fast, and new concepts emerge with amazing speed. This version expands its discussion of a lot of important new topics, including peer-to-peer networks, Ipv6, overlay and content distribution networks, MPLS and switching, wireless and mobile technology, and more. It also contains an earlier and stronger focus on applications, which reflects the student and professional’s increased familiarity with a wide range of networked applications. The book continues its tradition of giving you the facts you need to understand today’s world. But it has not lost track of its larger goal, to tell you not only the facts but the why behind the facts. The philosophy of the book remains the same: to be timely but timeless. What this book will teach you in today’s networked world will give you the insight needed to work in tomorrow’s landscape. And that is important, since there is no reason to believe that the evolution of networks is going to slow down anytime soon. It is hard to remember what the world looked like only ten years ago. Back then the Internet was not really a commercial reality. Ten megabits per second was really fast.We didn’t worry about spam and virus attacks—we left our computers unguarded and hardly worried. Those times were simpler, but today may be more exciting. And you better believe that tomorrow will be different from today: at least as exciting, with luck no less trustworthy, and certainly bigger, faster and filled with fresh innovation. So I hope Larry and Bruce can relax for a little before they have to start the next revision. Meanwhile, use this book to learn about today and get ready for tomorrow. Have fun.
我很荣幸能够与大家分享一下我在“计算机辅助的土木基础设施工程”期刊投稿经验。我在这个领域已经从事多年,因此对于这个期刊投稿有着一些体会心得。 首先,我认为投稿前要充分了解期刊的发表要求范围,特别是对于“计算机辅助的土木基础设施工程”这样的专业期刊,对于文章内容形式都有着严格的要求。因此在投稿之前,我会仔细阅读期刊投稿指南,确保自己的文章符合要求。 其次,我觉得在写作过程中,要注重论文的创新性实用性。期刊的编辑审稿人更加关注那些具有创新理念实际应用意义的研究成果。所以,我在写作过程中会力求深入挖掘问题,提出创新的解决方案,并且充分展现研究结果的实际应用性。 最后,我认为与期刊编辑审稿人的互动沟通非常重要。在投稿过程中,我会积极主动地与编辑审稿人保持联系,及时回复他们的意见建议,以确保论文能够顺利发表。 总的来说,我觉得“计算机辅助的土木基础设施工程”期刊是一个非常优秀的学术平台,它为广大研究者提供了一个很好的交流展示研究成果的机会。通过我多次投稿经验,我已经进一步提高了自己的学术写作水平研究能力。希望未来能够有更多的学者研究者能够通过这个期刊分享他们的研究成果,共同推动学术研究的进步。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值