蛋白序列GO号注释及问题

#===============================      版本1  ===============================================
InterProScan的三种使用方法
Interproscan,通过蛋白质结构域和功能位点数据库预测蛋白质功能。是EBI开发的一个集成了蛋白质家族、结构域和功能位点的非冗余数据库。Interproscan整合了一些使用最普及的一些数据库,并应用于功能未知的蛋白进行Interpro注释和GO注释。
以下介绍3中interpro注释的方法:

三、本地化的InterProScan注释
3.1 本地化的InterProScan安装与配置

3.1.1 从ftp://ftp.ebi.ac.uk/pub/databases/interpro/iprscan下载以下5个文件:

RELEASE/latest/iprscan_v4.8.tar.gz
BIN/4.x/iprscan_bin4.x_[PLATFORM].tar.gz
DATA/iprscan_DATA_[LATESTDATAVERSION].tar.gz
DATA/iprscan_PTHR_DATA_[LATESTDATAVERSION].tar.gz
DATA/iprscan_MATCH_DATA_[LATESTDATAVERSION].tar.gz

3.1.2 将5个文件解压到一个文件夹中,然后运行其中的文件Config.pl,来对InterProScan进行配置。
3.1.3 配置的过程中,若选择进行本地web配置,则修改本地www服务的配置文件,以能进行本地化网页版的运行。
3.2 本地化InterProScan的使用。
3.2.1 命令行运行iprscan的方法:

$bin/iprscan -cli -iprlookup -goterms -format xml -i test.fasta -o test.out

# help

http://www.chenlianfu.com/?tag=iprscan

 

该模块中XML::Parser    XML::Parser::Expat 这两个模块,后一个必须先安装,后续一个接着安装,由于是C层面的模块,需要安装一些东西

 Expat must be installed prior to building XML::Parser and I can't find it in the standard library directories. Install 'expat-devel' (or 'libexpat1-dev') package

小提示: (root或者sudo权限)  yum 或者 apt-get install expat-devel  (具体版本具体办)

#==============================================    版本2   =============================================

https://github.com/ebi-pf-team/interproscan/wiki   原文链接

第一步: 环境配置

Software requirements:

  • 64-bit Linux
  • Perl (default on most Linux distributions)
  • Python 2.7.x only
  • Oracle's Java JDK/JRE version 8 (required by InterProScan 5.17-56.0 onwards). Earlier InterProScan release versions required Java 6 (version 6u4 and above) or Java 7.
  • Environment variables set
    • $JAVA_HOME should point to the location of the JVM

                    $JAVA_HOME/bin should be added to the $PATH

第二步: 数据下载

wget ftp://ftp.ebi.ac.uk/pub/soft

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
是的,您说得对。emapper.annotations是eggnog-mapper的主要输出文件之一,包含了输入序列的各种注释信息和统计数据。具体来说,每行代表一个输入基因或蛋白质,列包括以下内容: 1. **query_name**:输入序列的ID。 2. **seed_eggNOG_ortholog**:输入序列的Seed Ortholog的EGGNOG Ortholog Group ID。 3. **seed_ortholog_evalue**:输入序列和Seed Ortholog的比对E-value。 4. **seed_ortholog_score**:输入序列和Seed Ortholog的比对Bit-Score。 5. **Predicted_gene_name**:预测的基因名称。 6. **GO_terms**:Gene Ontology (GO) ID和term。 7. **KO**:KEGG Orthology (KO) ID。 8. **KEGG_Pathway**:预测的KEGG Pathway ID和描述。 9. **KEGG_Module**:预测的KEGG Module ID和描述。 10. **KEGG_Reaction**:预测的KEGG Reaction ID和描述。 11. **KEGG_rclass**:预测的KEGG Reaction Class。 12. **BRITE_hierarchy**:预测的BRITE hierarchy。 13. **COG**:Clusters of Orthologous Groups (COG) ID和描述。 14. **eggNOG_ortholog_groups**:输入序列的所有EGGNOG Ortholog Group ID。 15. **best_eggNOG_ortholog_evalue**:输入序列和最佳EGGNOG Ortholog的比对E-value。 16. **best_eggNOG_ortholog_score**:输入序列和最佳EGGNOG Ortholog的比对Bit-Score。 17. **Predicted_taxonomic_group**:预测的序列所属的分类群。 18. **Predicted_protein_name**:预测的蛋白质名称。 19. **COG_cat**:COG分类。 这些注释信息和统计数据可以用于进一步的生物信息学分析和可视化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值