一、分析背景
蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性。鉴定一个蛋白中的结构域有助于更深入地理解蛋白功能。Pfam是一个大型蛋白结构域家族的数据库,每个蛋白家族都由多个序列比对和HMMs(hidden Markovmodels,隐马尔可夫模型)所体现。
Pfam包括两个质量级别的家族数据库:Pfam-A和Pfam-B。Pfam-A来自基础序列数据库Pfamseq,是根据最新的UniProtKB数据建立的,质量较高。Pfam-B做为Pfam-A的补充,是一个未注释的低质量数据库,一般是由ADDA数据中的非冗余cluster自动生成的。虽然质量较低,但对于鉴定Pfam-A无法覆盖到的功能保守区域是非常有用的。
二、软件安装
tar zxf hmmer-3.1b1.tar.gz
cd hmmer-3.1b1
./configure
make
make check
make install
2. Perl语言的Moose包:(这一步我花了好多时间,因为有很多依赖包,还有一系列权限问题)下面是非root账户的安装方法(root账户如果环境变量配置没有问题的话直接cpanm Moose)
先登录个人账户运行下面命令:
wget -O- http://cpanmin.us | perl - -l ~/perl5 App::cpanminus local::libeval `perl -I ~/perl5/lib/perl5 -Mlocal::lib`echo 'eval `perl -I ~/perl5/lib/perl5 -Mlocal::lib`' >> ~/.profileecho 'ex