基于元胞自动机的交通系统建模与模拟_Gromacs基于OPLS-AA力场的聚合物建模及模拟...

14d7da9c293ec9c9821f47a230a2543b.png

本文内容包括:

  1. OPLS-AA力场简介/高分子模拟常用力场;
  2. 聚合物建模方法;
  3. Gromacs添加非标准残基建模聚合物的方法;
  4. 聚合物PDB文件生成;
  5. 开始模拟。

本文中所用到的文件可以在以下链接获取:

链接: https://pan.baidu.com/s/1UgZ0j2Wr1w1URTdzdlS-1Q 提取码: 8mrg


1

尽管Gromacs与Amber都包含适合蛋白质与核酸体系模拟的力场,但到目前为止罕有专为人工聚合物体系开发的力场。不同于蛋白质/核算具有有限种类的残基,聚合物原则上可以有无限种不同的单体,去为每一种单体都设定优化参数是不可能的。

因此在实际作业中,往往使用普通的全原子力场对高分子体系进行模拟,包括COMPASS(仅MS)、CVFF(仅MS),OPLS-AA, DREIDING,GAFF,MM3,AMBER等。关于这些力场在模拟中的准确度对比可参考:

https://tandf.figshare.com/articles/A_molecular_dynamics_study_of_water-soluble_polymers_analysis_of_force_fields_from_atomistic_simulations/7201007

https://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/20050198872.pdf

https://www.sciencedirect.com/science/article/pii/S0020768306002198

其中OPLS-AA是作为高分子模拟中比较常用的一种,全称Optimized Potentials for Liquid Simulations,转为准确再现凝聚态物化性质开发。被Gromacs原生支持,并且也有成熟的拓扑文件生成工具(LigParGen,TPPmktop,GMXtop),使用起来较为便捷。


2

高分子模拟的一大难点在于如何构建具有较高聚合度的分子以及拓扑文件。

对于聚合度低的情况(10-40个重复单元),最简单的方法是直接在GaussView中构建单体判断,重复拼接,保存为pdb格式然后将得到的分子直接丢到TPPmktop得到拓扑文件。

当聚合度较高时,以上方法就不再适用,一方面手动拼接上百个单元过于耗时,另一方面过大的大分子也不被TPPmktop等拓扑文件生成程序支持。此时推荐的方法是添加非标准残基来生成拓扑文件。残基的概念是来自于蛋白质,gromacs处理蛋白质建模的方法是通过pdb2gmx插件读取蛋白质pdb文件记载的残基名,匹配数据库对于蛋白质每个残基成键参数的定义来生成拓扑文件。对于人工高分子也可以用这种方法,通过自定义片段的信息(RTP文件),也就是添加非标准残基,来用pdb2gmx自动生成高分子的拓扑文件。


3

本文所有的文本编辑(RTP,PDB文件等)都默认使用Notepad++,会使用到一些特殊功能,建议安装。

首先在GaussView中构建单体单元,本例中使用的是DMA单元(N,N-DiMethylAcrylamide)

be95c18c6dbef03726d873a0a8c07c6b.png

c7fe77b8aa2c9536b3e80756cb0dde7d.png

全选原子,点击GaussView窗口菜单中的Custom Fragments(在DNA图标右边),选中一个Group右键点击New Fragment from active molecule,就得到了自定义的基团,然后构建一个三单元的聚合物用于获取头基、尾基及中间单元的RTP文件,保存为PDB格式。这里建议修改原子名称,将同元素原子用编号区别开,例如按照如下格式,记得要保持原有对齐,比原来多了几个字符就在其后删去多少空格(参考压缩文件1.pdb):

C1 H11 H21 H31 C2 H21 C3 O N C4 H41 H42 H43 C5 H51 H52 H53……

(第二个重复单元也可以C1开始编号)

7c1d798c2a55914e113a3eb86514f87b.png

将所得pdb文件提交到TPPmktop ,点击Load PDB file for making all-atom OPLS topology右边的按钮提交文件,得到生成的itp与rtp文件。我们只需要rtp文件。

rtp文件包含了指认的原子类型、成键类型、improper二面角,其它未指认的均使用opls-aa的默认参数。

[ atoms ]从左到右包括了原子名称,指认的原子种类,电荷,所在碳原子编号
  C1     opls_135   -0.180     1 

[ bonds ]只包含了原子连接的信息,参数依照指认的原子类型读取自opls-aa参数库
 C5     H43

[ impropers ]包含了涉及的原子与improper二面角类型,参数读取自opls-aa参数库
  C2    O   C3  H53 improper_O_C_X_Y 

在这里我们需要依据这些数据构建自己的rtp文件,由于头基包含17个原子,从得到的rtp文件顺序复制前17个原子信息即可,注意核对电荷总和,对于中性的残基片段应为0;但bonds的顺序是乱的,这里我们就不使用得到的rtp文件,自己按照成键规则编辑,注意一项是,与下一个片段相连的键,需要在下个片段的原子前加上+,表示是下个片段的头原子,在下个片段时则在上个片段相连的原子前加上-号,表示与上个片段的末原子相连;improper项根据这个片段的原子从得到的rtp中复制,如果出现与下个原子相连的情况,也需要加上+号。

最终效果(这里只列举了其中一个残基,完整见压缩文件DMA.rtp):

[ BEG ]                                        ;残基名称,自定义
[ atoms ]
  C1     opls_135   -0.180     1 
  H11    opls_140    0.060     1 
  H12    opls_140    0.060     1 
  H13    opls_140    0.060     1 
  C2     opls_137   -0.060     2 
  H21    opls_140    0.060     2 
  C3     opls_235    0.500     3 
  N      opls_239   -0.140     4 
  O      opls_236   -0.500     5 
  C4     opls_243   -0.110     6 
  C5     opls_243   -0.110     7 
  H41    opls_140    0.060     6 
  H42    opls_140    0.060     6 
  H43    opls_140    0.060     6 
  H51    opls_140    0.060     7 
  H52    opls_140    0.060     7 
  H53    opls_140    0.060     7 
[ bonds ]
 C1	H11 
 C1	H12  
 C1	H13 
 C1	C2 
 C2	H21
 C2	+C1                  ;与下个片段的头原子相连
 C2	C3 
 C3	O
 C3	N
 N	C4
 N	C5
 C4	H41
 C4	H42
 C4	H43
 C5	H51
 C5	H52
 C5	H53
[ impropers ]
  C2    N   C3    O improper_O_C_X_Y 
  C3   C4    N   C5 improper_Z_N_X_Y 

将编辑好的rtp文件放到 你的gromcas文件夹/share/gromacs/top/oplsaa.ff内即可使用


4

对于构建较高分子量的聚合物,通过脚本复制重复单元来生成高分子链是可行的方法,本文使用的脚本来自李继存老师,请先阅读以下链接学习脚本的原理和使用方法,本文不再赘述:

https://jerkwin.github.io/2017/08/27/%E6%8B%BC%E6%8E%A5%E5%88%86%E5%AD%90%E7%9A%84%E7%AE%80%E5%8D%95%E8%84%9A%E6%9C%AC/​jerkwin.github.io

编辑之前得到的1.pdb,删去头基尾基除了碳的所有原子(这个在notepad中删除更快点),然后修改头尾碳为氯原子(用于标识),并用GaussView修改C-Cl键长为原来的一半,然后另存为gjf文件(如果gjf文件带有残基名,那么先存为mol2再存为gjf除去残基名),用notepad打开gjf文件,只复制原子坐标信息,粘贴到新文件中,在首行插入片段的原子数,再留一空行,保存为1.xyz,然后使用以上链接的脚本(或者压缩包的polymerize.sh)生成聚合物xyz文件。

直接生成的聚合物存在几何构型不合理的问题,往往会被VMD判定存在不合理的成键,但在能量最小化中可以解决。

要使用pdb2gmx生成拓扑文件,我们需要得到带有残基号的PDB文件。所以下一步是用得到的xyz文件得到带有残基名的pdb文件。

pdb文件有一点麻烦的是文件里面的每个记录都有着严格的格式。每个记录中的字段, 如标识, 原子名称, 原子序号, 残基名称, 残基序号等, 不仅要按照严格的顺序书写, 而且每个字段所占的字符串长度, 及其所处的位置都是严格规定好的。建议阅读以下链接了解格式说明:

https://jerkwin.github.io/2015/06/05/PDB%E6%96%87%E4%BB%B6%E6%A0%BC%E5%BC%8F%E8%AF%B4%E6%98%8E/​jerkwin.github.io

在这里我使用自己编辑的excel文档xyz2pdb.xlsx与notepad来转换xyz格式并确保得到的pdb文件格式合法

a667db53253e844a18f2b1ced983324f.png

如图所示,在P列左端的为工作区,用于记载原始数据,黑粗闸线框住的是输出区

具体的使用方法如下:

首先另开表格导入高分子的xyz文件(包含原子名称,坐标),将原子名称一列复制到O列,坐标复制到KLM三列。C列是原子序号。E列的原子名参考RTP的命名方式。G列用于修改残基名,自己定义。I列是判断残基序号的,你需要根据自己体系的残基原子数来修改I列,这里我在MID残基处使用=IF(I18<10," ",(IF(I18<100," "," ")))函数来判断残基序号。

其它空列(BDFHJ)并非无用,包含了为了对齐pdb格式所用的空格及函数,根据自己需要修改(一般不需要动)。

修改完后,直接复制整个黑粗闸线区的内容到notepad上并转换tab为空格(在编辑>空白字符操作一栏,这步很重要)即可得到标准pdb格式的文件。


5

做好以上工作后,就可以使用pdb2gmx指令得到top拓扑文件与gro坐标文件;不过由于指认二面角的函数类型有误,所得到的拓扑文件还需要经过修改。

打开拓扑文件,修改[ dihedrals ]项的函数类型为“3”(第五个个数字),improper[ dihedrals ]项的函数类型为“4”,这个操作在notepad上批量修改较为方便(例如替换“1 i”为“4 i”,含空格)。

gro文件可能也需要修改,当聚合度很高时,某个坐标数值也会变得很大,自动创建的模拟盒子大小也会不足够,这时修改gro文件最后一行为一个合适的数值(三个数字均为最长值的两倍),进行能量最小化与真空NVT模拟后,笔直的高分子就会蜷缩为一团,这时候再调整模拟盒子大小为你期望的值,然后用solvatebox 指令添加溶剂

704cdf88106c4bc410276e294787e2a7.png
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值