Pfam 数据库是一个广泛用于对蛋白质序列进行家族和结构域分类的重要资源,为分析新基因组、宏基因组以及指导特定蛋白质和系统的实验工作提供了有力支持。
用高质量的**隐马尔可夫模型(HMMs)**对蛋白质序列中的结构域进行识别、分类与注释。
Pfam 常被用于蛋白质结构域注释、功能预测、序列比对和进化分析。
Pfam 数据库简介
属性 | 描述 |
---|---|
全称 | Protein families |
创建机构 | EMBL-EBI 与 Sanger Institute 等合作维护 |
官网 | https://pfam.xfam.org |
版本更新 | 定期更新(每年1–2次) |
注释对象 | 蛋白质中的保守结构域、家族、功能位点 |
核心内容 | 每个 Pfam family 都有一个代表其特征的HMM 模型,用于序列识别 |
Pfam 的核心原理:隐马尔可夫模型(HMM)
Pfam 的结构域识别依赖于Profile HMM(轮廓隐马尔可夫模型ÿ