水中的溶菌酶 第一步:准备拓扑

原始文档来自GROMACS官方教程2018,由Mornight黎英(B站用户名:蓝灵是能鸽善鹉的鸭)翻译

我发誓这真的是人工翻译的,虽然看上去很机翻(抓脸)水平很差,各位见谅

GROMACS基础

从GROMACS 5.0版本开始,所有工具都作为必要模块包含在gmx程序内,这与之前的版本不同。在以前的版本中,每个工具由各自的命令单独调用。这种做法在5.0版本中仍然可以借助符号链接来生效,但未来的版本将不再支持,所以最好要习惯新的做法。想要获取任何GROMACS模块的帮助信息,你可以用以下任意一个命令来调用:

gmx help (module)

【译者注:例:gmx help pdb2gmx】

gmx (module) -h

【译者注:例:gmx pdb2gmx -h】

(module)替换为你想查询的命令即可,相关信息将输出至终端,其中包括可用的算法、选项、需要的文件格式, 已知的缺陷和限制等。对GROMACS的新用户来说,查看常用命令的帮助信息是了解每个命令功能的好方法。现在,开始有趣的部分吧!

溶菌酶教程

我们必须先下载要处理的蛋白质晶体结构文件。在这个教程中,我们将使用鸡蛋清溶菌酶(PDB代码 1AKI)。进入RCSB网站,下载晶体结构的PDB文本。【译者注:Linux下载后面带(gz)的,Windows下载后面不带(gz)的;对于同源多聚体蛋白,注意下载Biological Assembly以获得多聚体结构。如果PDBBiological Assmebly仍是单体,请下载CIF格式】

下载好结构之后,你就能通过可视化软件(如VMD,Chimera,PyMOL等)来可视化查看了。查看这个分子后,你要把它晶体结构里的水(PDB文件中的残基“HOH”)去除。去除水时可以使用简单文本编辑器ei、emacs之类(Linux/Mac),或Notepad(Windows)【译者注:Windows最推荐用Visual Studio Code。不要使用文档处理软件!【译者注:这是因为文档处理软件(wordWPS之类)会在字符后添加额外的内容,不在文档中显示,但在代码里存在】或者,你可以用grep非常方便地删除这些行:

grep -v HOH 1aki.pdb > 1AKI_clean.pdb

【译者注:grep仅适用于Linux、Mac终端,在Win下还是直接用VScode打开手动删除HOH的行】

要注意的是,这个处理并不是普遍适用的(例如,紧密结合或功能活性位点中的水分子)。对于当前目标,我们不需要结晶水。

经常检查PDB文件中MISSING注释下所列的信息,这些条目指示了晶体结构中不存在的原子或氨基酸残基。末端可能缺失,且在模拟中可能不会引起问题。但不完整的内部序列或任何氨基酸残基原子的缺失都将导致pdb2gmx运行失败。这些缺失的原子/残基必须用其他软件建模来补充完整【译者注:缺失原子可以用SPDBV填补,缺失残基如果无法用同源模建补全,就直接用SPDBV给蛋白封端,即添加C端氧原子,将末端补充完整】。并且,请注意pdb2gmx不是万能的,不是所有分子的拓扑都能用它生成,只有力场(在.rtp文件中,通常是蛋白,核酸和一些非常有限的辅因子,如NAD(H)和ATP)中已经定义的残基才能用pdb2gmx自动生成。

现在,晶体水都已去除,我们也已确认过所有必要原子都存在,PDB文件只包含蛋白质分子,即将进入GROMACS的第一个模块——pdb2gmx。使用这个模块的目的是生成三个文件:

1.分子拓扑

2.位置限制文件

3.处理后的结构文件

拓扑文件(默认topol.top)包含所有在模拟中定义分子所必需的信息。这个信息包括非键参数(原子类型、电荷)和键参数(键,角与二面角)。在拓扑文件生成后,我们将更加细致地查看它。

通过以下命令执行pdb2gmx

gmx pdb2gmx -f 1AKI_clean.pdb -o 1AKI_processed.gro -water spce

【译者注:-f -o -water为pdb2gmx的选项。-f 为输入结构文件,-o为输出结构文件,-water为选择的水模型。命令中本来应该有-p 生成拓扑文件和-r 生成位置限制文件,但本教程中使用默认设置,于是没有在命令行选项里写明。如果需要自定义生成的拓扑文件和位置限制文件的文件名,请使用-p -r。-water其实也不是一定要在命令行中写明的选项,因为如果不写,gromacs会在终端提示询问你想要选择的水模型是什么,此时也可以输入选择的水模型。】

【译者注:关于水模型:gromacs自带的有SPC(简单点电荷模型,spc),SPC/E(扩展的简单点电荷模型,spce),TIP3P(三点水模型,tip3p),TIP4P(四点水模型,tip4p),TIP5P(五点水模型,tip5p)。关于这几个模型的简单介绍请关注我在b站的视频:BV18M411k7SA】

pdb2gmx将处理结构,并提示你选择一个力场:

Select the Force Field:
From '/usr/local/gromacs/share/gromacs/top':
 1: AMBER03 protein, nucleic AMBER94 (Duan et al., J. Comp. Chem. 24, 1999-2012, 2003)
 2: AMBER94 force field (Cornell et al., JACS 117, 5179-5197, 1995)
 3: AMBER96 protein, nucleic AMBER94 (Kollman et al., Acc. Chem. Res. 29, 461-469, 1996)
 4: AMBER99 protein, nucleic AMBER94 (Wang et al., J. Comp. Chem. 21, 1049-1074, 2000)
 5: AMBER99SB protein, nucleic AMBER94 (Hornak et al., Proteins 65, 712-725, 2006)
 6: AMBER99SB-ILDN protein, nucleic AMBER94 (Lindorff-Larsen et al., Proteins 78, 1950-58, 2010)
 7: AMBERGS force field (Garcia & Sanbonmatsu, PNAS 99, 2782-2787, 2002)
 8: CHARMM27 all-atom force field (CHARM22 plus CMAP for proteins)
 9: GROMOS96 43a1 force field
10: GROMOS96 43a2 force field (improved alkane dihedrals)
11: GROMOS96 45a3 force field (Schuler JCC 2001 22 1205)
12: GROMOS96 53a5 force field (JCC 2004 vol 25 pag 1656)
13: GROMOS96 53a6 force field (JCC 2004 vol 25 pag 1656)
14: GROMOS96 54a7 force field (Eur. Biophys. J. (2011), 40,, 843-856, DOI: 10.1007/s00249-011-0700-9)
15: OPLS-AA/L all-atom force field (2001 aminoacid dihedrals)

力场决定着将被写入拓扑文件的信息,所以这是个非常重要的选择!你必须浏览每个力场,决定哪个最适于当前体系。在本教程中,我们将使用全原子力场OPLS-AA。在终端输入15,然后敲回车

【译者注:我很不喜欢OPLS-AA!!!我也一点都不推荐你们用这个力场!!!这个力场在后面参数设置里有很多和别的力场不一样的地方,而且使用范围很有限!我最推荐使用的是AMBER,大家如果有需要模拟体系里存在有机小分子配体的,用AMBER就对了。官方教程也有很多坑人的地方,大家一定要擦亮眼睛小心上当!!】

pdb2gmx还有很多其他选项,一些常用的列举如下:

-ignh:忽略PDB文件中的H原子;特别适用NMR解析的结构。否则,如果H原子存在,他们必须被命名为GROMACS力场中对应的名称【译者注:如:HAHB1HB2。这种方法太麻烦,所以各位蛋白里如果有H,一定要加-ignh。后面不用写任何选项。】。由于对氢原子存在许多不同的约法,所以处理起来非常头痛!如果你需要保留原始结构中H原子的坐标,但又需要将所有H重命名,那么Linux sed命令会是一个好帮手【意思是在Windows处理的话就别想着这个了】

-ter:交互式指定N-末端和C-末端的电荷状态

-inter:交互式指定Glu,Asp,Lys,Arg,His的电荷状态;选择包含在二硫键中的Cys

现在,你已经生成了三个新文件: 1AKI_processed.gro, topol.topposre.itp1AKI_processed.gro是一个GROMACS格式的结构文件,包含所有在力场中定义的原子(例如,H原子已添加到蛋白质的氨基酸残基上)。topol.top文件是系统拓扑文件(稍后会作解释)。posre.itp文件包含限制重原子位置的信息(以后会做解释)。【译者注:我现在就要解释。.top和.itp本质上是同一种文件,它们的内容规则是完全一样的,只不过.top作为总拓扑文件,而.itp作为总文件的一个部分】

最后一个注意事项:很多用户认为只能使用.gro文件。这是不对的。GROMACS可以处理很多不同格式的文件,而.gro只是命令默认输出匹配拓扑的文件。这种格式十分紧凑,但精度有限,如果你更愿意使用PDB之类的格式,只需要指定合适的文件名,然后以.pdb作为扩展名输出。pdb2gmx的目的主要是生成力场对应的拓扑;输出的结构文件只不过是这个处理过程的副产品,其实也就是为了方便用户。格式可以任意选择(查看GROMACS手册以了解不同格式)。

  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值