读书笔记:《生物信息学与功能基因组学》第十章(第三部分)
标题:多序列比对的数据库资源与实际操作
多序列比对数据库资源
- Pfam:基于profile HMM的蛋白家族数据库,提供序列多重比对和蛋白家族的profile HMMs。
- SMART:简单分子构架研究工具,使用基于profile HMMs的HMMER软件。
- 保守结构域数据库(CDD):NCBI工具,允许基于序列或文本方式对Pfam和SMART进行查询。
- BLOCKS:数据库只包含对应于蛋白质高度保守区的无空白多序列比对。
- PRINTS:数据库包含了定义于SwissProt/TrEMBL中的蛋白质家族的蛋白“指纹”。
- PROSITE:数据库提供了对蛋白质结构域和蛋白家族的描述。
访问数据库
- 通过网站地址访问各个数据库,进行序列搜索、文本搜索或浏览家族信息。
实际操作指南
- 使用Pfam数据库:通过文本搜索“lipocalin”,获取与载脂蛋白相关的注释和多序列比对文件。
- SMART数据库搜索:输入特定蛋白质序列,获取关于结构域组织和组成的描述。
- CDD搜索:使用RPS-BLA