我们知道蛋白一般由一个或多个功能域所组成,在不同蛋白质组合中出现的不同结构域导致了自然界中蛋白质复杂的多样性。鉴定一个蛋白中的结构域有助于更深入地理解蛋白功能。其中Pfam是一个大型蛋白结构域家族的数据库,每个蛋白家族都由多个序列比对和HMMs(hidden Markovmodels,隐马尔可夫模型)所体现。那么我们利用Pfam做一些转录因子分类相关的工作呢?下面我以番茄中WOX家族的分类为例做出详尽的解答。
首先我们需要进入Pfam,在搜索栏目上输入WOX,下图输出的结果。Homebox domain明显是WOX所含有的domain,这里我们点开PF00046。
Pfam wox输出结果
点开PF00046
这里有关于Homebox domain详尽的介绍,如果要继续做分类的话,注意左边上方的Alignment,继续点击。
点开Alignment后
这里需要注意的是,如果下面利用HMMER做分类的话,格式一定要选Stockholm,点击下面Generate,相应的文件即可生成在桌面。
下面将桌面的文件传到服务器,我一般利用SecureCrt的rz命令。
接着我们利用HMMER软件做分类。HMME