linux做溶菌酶教程时怎么去掉结晶水,md基本教程-溶菌酶的水溶液的md模拟

62e50291a81fc54b507f33cb80033297.gif md基本教程-溶菌酶的水溶液的md模拟

(14页)

4c3c10e6975871975d1d2433de2071a7.gif

本资源提供全文预览,点击全文预览即可全文预览,如果喜欢文档就下载吧,查找使用更方便哦!

14.9 积分

溶菌酶水溶液的简单分子动力学模拟教程GROMACS是一个使用经典分子动力学理论研究蛋白质动力学的工具1。这个软件包遵守GNU协议,因此可以免费从其主页(HTTP//WWWGROMACSORG)上下载。GROMACS可以在LINUX、UNIX和WINDOWS上使用。第一步建立拓扑结构本教程使用鸡蛋清溶菌酶(PDBCODE1AK1)作为目标蛋白质。首先需要从RCSB(HTTP//WWWRCSBORG/PDB/HOME/HOMEDO)网站下载其三维结构文件。然后通过诸如SYBYL、DISCOVERYSTUDIO、VMD、CHIMERA和PYMOL等图形显示软件分析其三维结构。根据模拟的需要去除或保留该文件中的结晶水分子。例如,在研究蛋白质和配基之间的亲和作用时,结合在活性位点附近的水分子就必须保留。但如果利用MD模拟研究蛋白质的构象转换时,蛋白质中的结晶水就可以删除。删除PDB文件中分子可以利用简单的文本编辑软件如VILINUX、EMACSLINUX/MAC和NOTEPADWINDOWS删除这些分子所对应的条目。例如,如果要删除文件中高的结晶水就可以将PDB文件中的所有“HOH”残基删除。切记不要用文字处理软件WORD处理该文件。在运行PDB2GMX程序之前,一定要检查PDB文件中的MISSING条目。这些条目会标注出该晶体结构中缺失哪些原子或残基。这一步是必须做的,因为不完全氨基酸残基或分子都会导致PDB2GMX命令的失败。这些遗失的原子或残基必须利用其他的软件补充完整。但末端的遗失可能不会对动力学模拟的顺利进行造成影响,但有可能会对结果有影响。此外,还要注意PDB2GMX程序并不是万能的,它并不能为所有的分子建立拓扑结构,仅能对一些力场中定义好的分子才有效,例如大部分蛋白质,核酸,还有一些辅因子如NAD、NADH、ATP和ADP等。此外,一些糖类(海藻糖等)的力场也都定义好,可以从力场文件中获得。因此,如果目标蛋白质含有小分子配基的,在运行该软件之前就需要先用简单的文本编辑软件将配基删除。最后除去结晶水和小分子配基,同时确保所有必需原子存在,此时的PDB文件中只含蛋白质原子,现在可以运行PDB2GMX命令了。常用PDB2GMX命令的详细参数PDB2GMXF1AKIPDBO1CONFGRO–PCONFTOP–IGNH此时程序会提示你选择力场(力场的选择类型与你安装的力场密切相关)SELECTTHEFORCEFIELDFROM'/USR/LOCAL/GROMACS/SHARE/GROMACS/TOP'1AMBER03FORCEFIELDDUANETAL,JCOMPCHEM24,19992012,20032AMBER94FORCEFIELDCORNELLETAL,JACS117,51795197,19953AMBER96FORCEFIELDKOLLMANETAL,ACCCHEMRES29,461469,19964AMBER99FORCEFIELDWANGETAL,JCOMPCHEM21,10491074,20005AMBER99SBFORCEFIELDHORNAKETAL,PROTEINS65,712725,20066AMBER99SBILDNFORCEFIELDLINDORFFLARSENETAL,PROTEINS78,195058,20107AMBERGSFORCEFIELDGARCIANAMENREXCLPROTEIN_A3“PROTEIN_A“是分子的名字,即蛋白质在PDB文件中被标为A链。大部分内容为蛋白质分子中的原子信息,以下所示ATOMSNRTYPERESNRRESIDUEATOMCGNRCHARGEMASSTYPEBCHARGEBMASSB1OPLS_2871LYSHN103140067QTOT032OPLS_2901LYSHH110331008QTOT0033OPLS_2901LYSHH210331008QTOT0364OPLS_2901LYSHH310331008QTOT0695OPLS_293B1LYSHCA102512011QTOT0946OPLS_1401LYSHHA10061008QTOT1注释如下NR原子数;TYPE原子类型;RESNR氨基酸残基数;RESIDUE氨基酸残基名;注意,在PDB文件中为”LYS”;而在RTP文件中改为LYSH表明赖氨酸质子化。ATOM原子名;CGNR带电基团数,带电基团定义整个基团所带电荷为整数,这样有利于加速计算;CHARGE原子所带电荷;MASS原子质量。BONDS成键信息;PAIRS成对信息;ANGLES键角信息;DIHEDRALS二面角信息TYPEB,CHARGEB和MASSB在自由能微扰计算过程中需要指定,在本章中不予讨论。POSREITP建立位置限制,它定义了在平衡中用于保持原子位置的一种平衡常数INCLUDEPOSITIONRESTRAINTFILEIFDEFPOSRESINCLUDE“POSREITP“ENDIF至此对蛋白质A的分子类型设定基本结束。拓扑文件中剩余的内容都是用来定义其他分子和描述系统的等级。1定义水分子类型INCLUDEWATERTOPOLOGYINCLUDE“OPLSAAFF/SPCEITP“IFDEFPOSRES_WATERPOSITIONRESTRAINTFOREACHWATEROXYGENPOSITION_RESTRAINTSIFUNCTFCXFCYFCZ11100010001000ENDIF水分子也可以被限定位置,一般使用力常数为1000KJMOL1NM22离子参数描述INCLUDEGENERICTOPOLOGYFORIONSINCLUDE“OPLSAAFF/IONSITP“3最终来到系统等级设定SYSTEM指令给出系统名称并将在模拟中写入模拟文件,MOLECULES指令列出系统中所有分子。SYSTEMNAMELYSOZYMEMOLECULESCOMPOUNDMOLSPROTEIN_A1一些关于MOLECULES指令的提示1MOLECULES中所列分子顺序必须与轨迹文件(GRO)中分子的顺序一一对应,否则会出错;2名字列表必须与MOLECULETYPE名字一致,不只是残基名或其它。第二步定义模拟盒子大小本章模拟蛋白质在简单的水溶液中构象转换情况。当然我们也可以模拟蛋白质在任意溶液中的构象转换情况,如果能够获得这些溶剂分子的拓扑参数的话,如何获得分子的力场参数我们会在下面的内容中提到。在GROMACS软件中,定义盒子尺寸是用EDITCONF命令来完成的。现有多种晶胞类型供选择立方体,长方体和菱形十二面体。本章中我们选择最简单的立方体盒子作为晶胞。当你对周期性边界条件和盒子类型更加熟悉以后,可以使用菱形十二面体盒子,因为其体积是同周长立方体的71,这样就可以降低模拟体系内的水分子个数,从容大大节省计算量。EDITCONF的命令范例EDITCONFF1AKIGROO1AKI_BOXGROCD10BTCUBIC–BOX656565参数如下所示C使蛋白质位于盒子中央;D使蛋白质与盒子距离最近的原子与盒子边缘的距离大于等于1纳米。BT盒子类型。蛋白质距盒子边缘的距离是一个重要的参数。因为MD模拟中使用周期性边界条件,因此原子之间必须满足原子之间的距离最小规则,即蛋白质不能与其镜像发生作用,否则MD模拟过程中在计算力的过程中会发生错误。将蛋白质与盒子边缘距离设置为1纳米就意味着任何两个蛋白质镜像分子间的距离至少为2纳米。第三步加入溶剂分子现在可以向模拟盒子中添加溶剂水分子了。GENBOX命令可以完成以上操作GENBOXCP1AKI_BOXGROCSSPC216GROO1AKI_SOLVGROPCONFTOP此处溶剂水的结构是用GROMACS中的默认值(SPC216GRO)。它是一个预平衡好的的SPC水模型。输出结果为1AKI_SOLVGRO,此外需要指定GENBOX中拓扑文件的名字,以便对其进行修改,注意比较运算前后条目MOLECULES的改变。MOLECULESCOMPOUNDMOLSPROTEIN_A1SOL10832GENBOX仅需要记录加入的水分子数,稍后将其写入拓扑文件,从而改变模拟环境,因为水的信息更新是事先编程好的。注意如果模拟非水溶剂,GENBOX不会修改拓扑文件,此时就需要自己去修改添加。第四步加入离子从第一步PDB2GMX的输出结果可以看出,所模拟的蛋白质溶液系统的净电荷为22,这主要基于其氨基酸成分。如果你在PDB2GMX输出结果中没注意看到此信息,请转向拓扑文件中ATOMS指令的最后一行,应显示“QTOT8“。因为生命体是不带净电荷的。所以必须向系统中加入离子。在GROMACS中负责加入离子的工具叫做GENION。GENION的功能是检查拓扑文件并将相应数量的水分子利用特定的离子来替换。输入程序叫做输入运行文件(扩展名TPR),此文件由GROMACS工具GROMPP命令生成,之后的MD计算都将用到此命令。该命令是将轨迹文件和拓扑结构整合起来生成一个原子级的输入文件(TPR)。TPR文件包含系统中所有原子的参数。应用GROMACS工具GROMPP生成TPR文件我们需要一个扩展名为MDP分子动力学参数文件的文件,GROMPP命令将MDP文件中标明的参数整合结构和拓扑文件从而生成TPR文件。MDP文件通常用来运行能量最小化或MD模拟,但在此例中只是用来生成一个系统的原子级描述文件。实际上在此步应用MDP文件可以包含任意合法的参数组合,在此我仅应用能量最小化描述,因为他们是最基本的而且没有复杂的参数组合。用一下命令整合获得TPR文件GROMPPFIONSMDPC1AKI_SOLVGROPTOPOLTOPOIONSTPR现在我们获得了一个二进制文件IONSTPR,它从原子级别对系统进行了描述,现在我们用GENION命令来处理该文件GENIONSIONSTPRO1AKI_IONSGROPNAMENA–NP3处理时选择12组“SOL”作为离子的替代物,不要将蛋白质的原子替换成离子。在GENION命令中,需要TPR格式的文件S作为输入文件,输出一个GRO文件O,通过修改拓扑结构P文件来反映水分子的去除和离子的加入,同时定义正负离子名字PNAMEANDNNAME,RESPECTIVELY,并告诉GENION加入平衡系统净电荷所需的电荷种类和数量PN22。当然,也可以应用GENION中NEUTRAL和CONC等选项来加入一定浓度的离子或基团来平衡系统电荷。离子的命名在之前GROMACS版本中都是随力场而特定的,但在版本45之后命名已经被标准化。和MOLECULETYPE中一样,原子命名一般用大写字母标识。残基名前不可加/。当离子的命名遇到问题时,请参考IONSITP文件。现在MOLECULES指令应如下MOLECULESCOMPOUNDMOLSPROTEIN_A1SOL10824NA22CL0其中“CL0“说明系统中不存在氯离子。你可以删除它或不管它。GROMACS之前版本会报告错误,但40之后或更高版本允许0分子条目的出现。第五步能量最小化现在一个溶剂化的电中性的系统已经建立。但是在动力学模拟之前,我们还必须去除体系中的原子间的碰撞和不正确的几何构型。上述问题可以利用能量最小化的分子动力学模拟程序来解决。能量最小化过程与加入离子过程极为相似。我们需要再一次使用GROMPP命令将结构文件,拓扑文件和模拟参数整合获得一个二进制输入文件(TPR),但与上次将TPR文件作为GENION的输入文件不同,这一次我们将利用GROMACS中的MD引擎来进行能量最小化。通过以下输入参数文件来整合获得二进制的输入文件GROMPPFMINIMMDPC1AKI_IONSGROP1AKITOPOEMTPR当运行GENBOX和GENION时一定要确保拓扑TOPOLTOP文件已经得到更新,否则会有很多严重的错误信息。(如,许多COORDINATE文件中的坐标和拓扑文件不匹配。)现在我们可以利用MDRUN来实现能量最小化了MDRUNVDEFFNMEMV参数很麻烦它将运算过程中的所有步骤都显示在屏幕上,以至于MDRUN非常冗长。DEFFNM参数定义了文件的输入和输出的名字。所以如果你的GROMPP的输出文件的命名不是“EMTPR,“,你就要用MDRUNSFLAG来清楚地命名。在此例中,我们将得到以下文件EMLOGASCII码格式能量最小化的日志文件EMEDR能量的二进制文件EMTRR精确轨迹的二进制文件EMGRO能量最小化后的结构文件这儿有两个参数来评估能量最小化是否成功,第一个是势能,它的值应为负,数量级应在100000至1000000之间,这取决于系统大小和水分子数量。另一个重要的参数为最大力FMAX,MINIMMDP中设置为“EMTOL10000“,这表明计算结果中力值不会超过1000KJMOL1NM1。有可能产生在合理势能水平下力的最大值超过1000KJMOL1NM1的情况。如果这种情况发生,说明该模拟还没有达到稳定。需要寻找原因并通过修改能量最小化中的参数来解决此问题。让我们做一些分析。EMEDR文件中包含EM过程中的所有能量数据。你可以通过GROMACS工具G_ENERGY来分析这些EDR文件。G_ENERGYFEMEDROPOTENTIALXVG在提示命令行中,键入“100“选择势能为10,0取消输入。你将获得势能的平均值,即“POTENTIALXVG“文件被生成。可以利用XMGRACE绘图软件绘出图形。结果如下图所示,该图表明该体系的势能已经收敛,达到平衡。能量最小化完毕,下面开始进行分子动力学模拟研究。第六步限制性分子动力学模拟NVT平衡能量最小化模拟已确保我们获得了几何构型和溶剂方面合理的初始结构。在开展动力学模拟研究之前,我们还必须平衡蛋白质周围的溶剂和离子,从而使模拟体系达到平衡。如果我们进行平衡动力学模拟,而直接进行分子动力学计算的话,研究系统可能会崩溃。原因在于溶剂没有很好的和溶质互相作用。通过在系统中加入模拟所需的温度和压力,从而使溶剂和离子通过构象微调来达到合适密度并使溶质蛋白质达到正确方位。还记得PDB2GMX命令生成的POSREITP文件吗我们现在需要用它了。它的目的是来限制蛋白质的重原子位置的。从而使我们的蛋白质溶液达到平衡。平衡动力学通常在两种状态下运算。第一只种状态为NVT系综(粒子数,体积和温度均为常数)。这个系综也称为“等温等容“或“正则系综“。该步的模拟时间与该模拟体系有关,但在NVT中,系统温度会在预设值达到高峰。如果温度不平衡,需要增加外模拟时间。一般的,50至100皮秒就足够了,在此例中我们选择100皮秒来使NVT环境平衡。根据所用的计算机不同,模拟时间也会不同。我们会上述的能量最小化步骤里一样运行GROMPP和MDRUNGROMPPFNVTMDPCEMGROPTOPOLTOPONVTTPRMDRUNDEFFNMNVT一份详尽的参数使用说明可以在GROMACSMANUAL中被找到。注意在MDP文件中的一些参数。让我们再一次使用G_ENERGY来分析体系的温度G_ENERGYFNVTEDR在命令行中键入150来设定温度并回车。结果如下图所示。第七步NPT平衡在前一步NVT平衡中系统温度已经稳定。在收集数据之前,我们也要使系统压力和密度稳定。系统压力平衡是在NPT系综(粒子数、压力、温度为常数)下完成的。此系宗亦称为“等温等压“系综,这是最接近实验条件的系综。这与NVT过程相似,注意附加的压力部分使用PARRINELLORAHMAN压力计。当NVT平衡过程中再一次使用GROMPP和MDRUN。注意我们现在添加T参数来包含NVT过程中的检查文件,此文件包含所有我们此次模拟所需的必要的系统变量。为了继续使用NVT过程中生成的速度,我们必须保存此文件。轨迹文件C是NVT模拟最终输出的轨迹文件。GROMPPFNPTMDPCNVTGROTNVTCPTPTOPOLTOPONPTTPRMDRUNDEFFNMNPT在此应用G_ENERGY分析压力过程G_ENERGYFNPTEDROPRESSUREXVG在命令行中输入“150“选择压力并退出。第八步取样MD模拟当前两步完成后,系统的温度和压力都得到了平衡。我们现在可以放开位置限制并运行PRODUCTIONMD来收集数据了。程序正如以前我们所见,所以我们利用GROMPP中的CHECKPOINT文件。我们将作1纳秒的模拟,脚本可在这里找到。GROMPPFMDMDPCNPTGROTNPTCPTPTOPOLTOPOMD_0_1TPRMDRUNDEFFNMMD_0_1因MDRUN步骤需耗费时间要几个小时,所以MD计算最好能在一个计算集群上进行。多进程运算指令如下MPIRUNNPXMDRUN_MPIDEFFNMMD_0_1这里X指明用于模拟的进程数,临近GROMPP输出的最后,你将看到如下句子ESTIMATEFORTHERELATIVECOMPUTATIONALLOADOFTHEPMEMESHPART025PME负荷的估计值将决定将有多少程序由PME执行,多少由PP执行。参考GROMACS4文章和教程能够以获得更多细节。在立方体盒子中,最理想情况为PME负荷为025对于十二面体最佳负荷为033。运行MDRUN时,系统将自动对PP和PME分配任务。为此请保证为你的计算系统选择合适的中间点以保证运算速度。第九步分析既然我们已经完成了分子动力学模拟,我们就需要分析该系统。在模拟之前有一个重要的问题就是什么样的数据是重要的。为了解决这个问题需要了解你所要在系统中收集的数据类型。在本教程中,一些基本工具将被介绍。第一种是TRJCONV,这是一种对时间等作后期处理的工具。我们用它来解释系统内的周期。蛋白质分子会在盒子内扩散,也有可能瞬间跳跃至盒子的另一端,为了消除这些现象,输入以下语句TRJCONVSMD_0_1TPRFMD_0_1XTCOMD_0_1_NOPBCXTCPBCMOLURCOMPACT选择0以输出。在此修改过的轨迹上我们进行以下的分析。首先来看结构稳定性,GROMACS有一内嵌模块G_RMS进行RMSD运算,运用G_RMS,输入以下语句G_RMSSMD_0_1TPRFMD_0_1_NOPBCXTCORMSDXVGTUNS蛋白质的廻转半径是其紧密度的一种度量。如果蛋白质被稳定的折叠,它RG值是恒定的。如果蛋白质是打开的,RG值会时刻变化。让我们来研究溶菌酶的廻转半径。输入以下语句G_GYRATESMD_0_1TPRFMD_0_1_NOPBCXTCOGYRATEXVG我们可以看到基本稳定的RG值,说明蛋白质基本稳定,在300K温度下紧密状态超过1纳秒。此结果是事先没有想到的,但这正说明了GROMACS的功能强大。至此我们已经创建了一个GROMACS的模拟环境并试着做了一些分析。但此教程只是简介,还有很多其他分析可以应用GROMACS(如自由能计算等),祥见下面的教程。注意由于版本的不同,每个软件的参数可能会有些微差别在所有的MDP文件中都要加入CPP“C\PROGRAMFILES\GROMACS\BIN\CPPEXE“在GENBOX一步中需要修改TOP文件,将上一步中生成的TOP文件拷贝一下,然后将其粘贴到新生成的文件中。HTTP//HIBAIDUCOM/FENGJIAN_STUDIO/BLOG/ITEM/83BECD2AEB567E23D42AF101HTMLHTTP//HIBAIDUCOM/FENGJIAN_STUDIO/BLOGHTTP//DXLI75BLOG163COM/BLOG/STATIC/10676828920108231144337/ 关 键 词: md 基本 教程 溶菌酶 水溶液 模拟

524d6daf746efaa52c3c71bbfe7ba172.gif  天天文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值