一. ProteinMPNN模型设计步骤
假设要用ProteinMPNN模型从头设计环状四聚体蛋白质,具体步骤如下:
1. 选择起点:已知的环状四聚体结构和序列
- 获取模板:找到一个已知的、能够形成环状四聚体的蛋白质。此蛋白质的序列和结构可以来自数据库(如PDB),或者通过同源建模、AlphaFold等方法预测。
- 结构分析:了解该结构中各亚基的相互作用和对称性。环状四聚体通常具有特定的对称性(例如C4对称),ProteinMPNN设计时需要利用这种对称性。
2. 准备ProteinMPNN的输入参数
-
生成主链特征:加载环状四聚体的主链结构,确保每个亚基的主链原子坐标是完整的。这一步可以通过对称性分析,确保主链和空间排布能够正确传达出环状四聚体的结构特性。
-
定义tied_featurize参数:
- tied_positions_dict:由于环状四聚体具有对称性,可以将对称的位点绑在一起,使这些位置的序列相同或具有相关性。这样做可以确保生成的序列支持环状结构的形成。
- fixed_position_dict:如果希望在四聚体中某些位点保持特定氨基酸(例如某些关键残基保持不变以稳定结构),可以在该字典中指定。可以参考已知的序列,固定功能性位点或相互作用界面位点。
- o