引言
在分子动力学模拟中,从PDB文件生成可靠的拓扑文件是至关重要的一步。
而GROMACS的pdb2gmx工具则为这一过程提供了强大的支持。无论是选择力场、生成拓扑文件,还是处理复杂残基和链的分离,该工具都能简化操作。然而,这一过程并非完全自动化,用户需要理解其核心功能和选项配置,才能生成符合研究需求的高质量输入文件。本文将为您全面解析pdb2gmx的使用方法,让您轻松掌控从PDB到拓扑文件的转换。
如需了解全面的流程请点击:《分子动力学新手入门:一文读懂GROMACS使用全流程,轻松开启模拟之旅》
gmx pdb2gmx核心
gmx pdb2gmx [ -f [<.gro/.g96/…>] ] [ -o [<.gro/.g96/…>] ] [ -p [<.top>] ]
gmx pdb2gmx [ -i [<.itp>] ] [ -n [<.ndx>] ] [ -q [<.gro/.g96/…>] ]
gmx pdb2gmx [ -chainsep <枚举> ] [ -merge <枚举> ] [ -ff <字符串> ]
gmx pdb2gmx [ -water <枚举> ] [ -[无]inter ] [ -[无]ss ] [ -[无]ter ]
gmx pdb2gmx [ -[无]lys ] [ -[无]arg ] [ -[无]asp ] [ -[无]glu ] [ -[无]gln ]
gmx pdb2gmx [ -[no]his ] [ -angle ] [ -dist ] [ -[no]una ]
gmx pdb2gmx [ -[无]ignh ] [ -[无]missing ] [ -[无]v ] [ -posrefc <真实> ]
gmx pdb2gmx [ -vsite <枚举> ] [ -[无]重氢] [ -[无]氘氢]
gmx pdb2gmx [ -[no]chargegrp ] [ -[no]cmap ] [ -[no]renum ] [ -[no]rtpres ]
gmx pdb2gmx读取.pdb (或.gro ) 文件,读取一些数据库文件,向分子添加氢原子,并生成 GROMACS (GROMOS) 格式的坐标,或可选的.pdb格式的拓扑。随后可以处理这些文件以生成运行输入文件。
gmx pdb2gmxforcefield.itp
将通过在当前工作目录和 GROMACS 库目录的子目录中查找文件来搜索力场,这些文件.ff 是根据二进制文件或GMXLIB环境变量的路径推断出来的。默认情况下,力场选择是交互式的,但您可以使用选项-ff在命令行上指定列表中的短名称之一。在这种情况下,只需查找相应的目录。gmx pdb2gmx.ff
选择力场后,所有文件都将从相应的力场目录中读取。如果要修改或添加残基类型,可以将力场目录从 GROMACS 库目录复制到当前工作目录。如果要添加新的蛋白质残基类型,则需要residuetypes.dat
在库目录中进行修改或将整个库目录复制到本地目录,并将环境变量设置GMXLIB为该目录的名称。
请注意,.pdb文件只不过是一种文件格式,它不一定包含蛋白质结构。数据库中支持的每种分子都可以转换。如果数据库中不支持,您可以自行添加。
该程序的智能有限,它读取大量数据库文件,从而能够生成特殊键(Cys-Cys、Heme-His 等等),必要时可手动完成。程序可以提示用户选择所需的 LYS、ASP、GLU、CYS 或 HIS 残基的类型。对于 Lys,选择是中性(NZ 上两个质子)或质子化(默认三个质子);对于 Asp 和 Glu,选择是非质子化(默认)或质子化;对于 His,质子可以在 ND1 上、NE2 上或两者上。默认情况下,这些选择是自动完成的。对于 His,这是基于最佳氢键构象。氢键基于简单的几何标准定义,由最大氢供体-受体角和供体-受体距离指定,它们分别由-angle和 设定-dist。
可以使用标记交互选择 N 端和 C 端的质子化状态-ter。默认末端分别为离子化(NH3+ 和 COO-)。一些力场支持单残基链的两性离子形式,但对于多肽,不应选择这些选项。AMBER 力场对末端残基具有独特的形式,这些形式与机制不兼容-ter。您需要分别在 N 端或 C 端残基名称前加上“N”或“C”以使用这些形式,并确保保留坐标文件的格式。或者,使用命名的终止残基(例如 ACE、NME)。
链的分离并非完全微不足道,因为用户生成的 PDB 文件中的标记经常变化,有时需要合并 TER 记录中的条目,例如,如果您想要两个蛋白质链之间的二硫键或距离限制,或者如果您有一个与蛋白质结合的 HEME 基团。在这种情况下,多个链应该包含在一个 moleculetype定义中。为了处理这个问题,使用两个单独的选项。首先,允许您选择何时开始新的化学链,并在适用时添加末端。这可以基于 TER 记录的存在、链 ID 更改的时间或其中之一或两者的组合来完成。您还可以完全交互地进行选择。此外,还有一个选项可以控制在添加所有化学末端(或不添加)后如何将多个链合并为一个分子类型。可以关闭此功能(不合并),可以将所有非水链合并为单个分子,或者可以交互地进行选择。gmx pdb2gmx-chainsep-merge
gmx pdb2gmx还将检查.pdb文件的占用字段。如果任何占用不是 1,则表明原子在结构中解析得不好,则会发出警告消息。当.pdb文件不是来自 X 射线结构测定时,所有占用字段可能为零。无论哪种方式,用户都需要验证输入数据的正确性(阅读文章!)。
在处理过程中,原子将根据 GROMACS 约定重新排序。-n可以生成一个索引文件,其中包含一个以相同方式重新排序的组。这允许您将 GROMOS 轨迹和坐标文件转换为 GROMOS。有一个限制:重新排序是在从输入中剥离氢之后和添加新氢之前进行的。这意味着您不应该使用-ignh。
.gro和文件格式.g96不支持链标识符。因此,当您想要转换多链.pdb文件时,在选项中输入.pdb文件名会很有用。-o
该选项-vsite可消除氢原子和快速不当二面角运动。通过将氢原子变为虚拟位点并固定角度(固定其相对于相邻原子的位置),可以消除角运动和平面外运动。此外,标准氨基酸(即 PHE、TRP、TYR 和 HIS)芳香环中的所有原子都可以转换为虚拟位点,从而消除这些环中的快速不当二面角波动(但此功能已弃用)。 请注意,在这种情况下,所有其他氢原子也会转换为虚拟位点。转换为虚拟位点的所有原子的质量都会添加到重原子中。
通过将氢质量增加 4 倍也可以减慢二面体运动-heavyh
。这也适用于水氢,以减慢水的旋转运动。氢质量的增加要从键合(重)原子中减去,以使系统的总质量保持不变。作为一种特殊情况,考虑环状(或循环)分子。 通过评估给定链的末端原子之间的距离自动确定是否存在环状分子。如果该距离大于 (“短键警告距离”,默认 0.05 纳米)且小于(“长键警告距离”,默认 0.25 纳米),则该分子被视为环状,并将按此进行处理。请注意,这不能检测周期边界上的环状键。gmx pdb2gmx-sb-lb
选项
- 指定输入文件的选项:
-f[<.gro/.g96/…>](蛋白质.pdb) 结构文件:gro g96 pdb brk ent esp tpr
指定输出文件的选项:
-o[<.gro/.g96/…>](conf.gro) 结构文件:gro g96 pdb brk ent esp
-p[<.top>] (topol.top) 拓扑文件
-i[<.itp>](posre.itp) 包含拓扑文件
-n[<.ndx>] (index.ndx)(可选) 索引文件
-q[<.gro/.g96/…>] (clean.pdb) (可选)
结构文件:gro g96 pdb brk ent esp
- 其他选择:
-chainsep<枚举> (id_or_ter) PDB 文件中应启动新链(添加末端)的条件:id_or_ter、id_and_ter、ter、id、interactive
-merge (无) 将多个链合并为单个 [moleculetype]: no, all, interactive
-ff<字符串>(选择) 力场,默认为交互。用于-h信息。
-water<枚举> (选择) 要使用的水模型:select、none、spc、spce、tip3p、tip4p、tip5p、tips3p
-[no]inter (不) 将接下来的 8 个选项设置为交互式
-[no]ss (不) 交互式 SS 桥选择
-[no]ter (不) 交互式终端选择,而非收费(默认)
-[no]lys (不) 交互式赖氨酸选择,而非带电选择
-[no]arg (不) 交互式精氨酸选择,而非带电
-[no]asp (不) 交互式天冬氨酸选择,而非带电
-[no]glu (不) 交互式谷氨酸选择,而非带电选择
-[no]gln (不) 交互式谷氨酰胺选择,而非带电选择
-[no]his (不) 交互式组氨酸选择,而不是检查氢键
-angle<真实> (135) 氢键的最小氢供体-受体角(度)
-dist<真实> (0.3) 氢键最大供体-受体距离 (nm)
-[no]una (不) 选择苯丙氨酸、色氨酸和酪氨酸上具有联合 CH 原子的芳香环
-[no]ignh (不) 忽略坐标文件中的氢原子
-[no]missing (不) 当原子缺失且无法形成键时继续,危险
-[no]v (不) 信息内容稍微详细一些
-posrefc<实际> (1000) 位置约束的力常数
-vsite<枚举> (无) 将原子转换为虚拟位点:无、氢、芳香族
-[no]heavyh (不) 使氢原子变重
-[no]deuterate (不) 将氢的质量改为 2 amu
-[no]chargegrp (是的) 在.rtp文件中使用电荷组
-[no]cmap (是的) 使用 cmap 扭转(如果在.rtp文件中启用)
-[no]renum (不) 在输出中对残基进行连续重新编号
-[no]rtpres (不) 使用.rtp条目名称作为残基名称
通过对pdb2gmx工具的深入学习和实践,
将能够高效处理复杂的分子结构,生成准确的拓扑文件,为后续的模拟工作奠定基础。
记住,理解选项的细节和对输入数据的审慎验证,是确保模拟结果可靠的关键。
希望本文能为您的分子动力学研究提供助力。如果您对其他GROMACS工具有兴趣,
欢迎持续关注以便获取后续更多资料!