基因家族鉴定---pfam保守结构域的查找
Pfam是一个蛋白家族数据库,其中Pfam-A是手工确定的高质量的蛋白家族,Pfam-B是自动注释的,是对A的补充。目前已更新到34.0,下载地址为ftp://ftp.ebi.ac.uk/pub/databases/Pfam/releases/,任选一版本即可,需要两个文件, Pfam-A.hmm.gz和 Pfam-A.hmm.dat.gz。
hmmer的安装
由于Pfam-A需要进行二进制的转换,方便运算,所以需要用到hmmer软件。
安装过程如下:
$ wget http://eddylab.org/software/hmmer/hmmer.tar.gz
$ tar zxvf hmmer.tar.gz
$ cd hmmer-3.3
$ ./configure --prefix=`pwd`
$ make