CADD课程学习(13)-- 研究蛋白小分子动态相互作用-II(水中的溶菌酶 GROMACS)
案例一:模拟体系:水盒子中的蛋白质(溶菌酶,lysozyme)及离子
本案例为一个蛋白质(溶菌酶,lysozyme)加上离子在水盒子里的模拟过程。
官方教程链接:http://www.mdtutorials.com/gmx/lysozyme/index.html
非官方中文翻译链接:http://jerkwin.github.io/GMX/GMXtut-1/
下载地址:http://public-ehs.oss-cn-hangzhou.aliyuncs.com/packages/Lysozyme.targz本教程适用于2018.x以上GROMACS版本
整体步骤
本案例需要的外部文件及跑完分子模拟的结果文件:
链接:https://pan.baidu.com/s/1jgoJR_kBSH4tdrTpBw4D0Q
提取码:asd8
第一步:准备拓扑文件
PDB 网站下载溶菌酶(PDBID:1AKI)
GROMACS基础:
获得GROMACS某一模块的帮助信息。可使用:
gmx help (module)
或
gmx (module) -h
使用时只要将其中的(module)替换为要查询的命令的实际名称即可.相关信息会输出到终端,其中包括可用的算法,选项,需要的文件格式/已知的缺陷和限制,等等,对GROMACS的新用户来说,查看常用命令的帮助信息是了解每个命令功能的有效方式。
处理pdb文件
查到是是否有断链,去掉结晶水分子,保存新的PDB(1AKI_clean.pdb)
方法一:在pymol中只保存蛋白部分
方法二:文本编辑器(如Notepad中,不要用Word,易出错),直接删掉PDB文件中与结晶水相关的行(残基为“HOH”的行)即可
方法三:grep -v HOH 1aki.pdb>1AKI_clean.pdb
注意:注意意检查pdb文件中MISSING注释下面列出的项,这些项代表了在晶体结构文件中缺失的那些原子鼓残基:在模拟中,未端区域的缺失可能并不会引起问题,但缺失原子的不完整内部序列或任何氨基酸残基都将导致pdb2gmx程序运行失败,必须使用其他软件对这些缺失的原子/残基进行建模并补充完整(如薛定谔或MOE等准备蛋白)。
使用:pdb2gmx模块
可产生:
- 分子拓扑文件
- 位置限制文件
- 后处理结构文件
拓扑文件(默认为topol.top)包含了定义模拟中质用分子的质有必需信品,包适非续参数(原子类型和电荷)和键合参数(键长,键角和二面角)
执行代码:gmx pdb2gmx -f 1AKI_clean.pdb -o 1AKI_processed.gro -water spce
pdb2gmx将处理结构,输出一些相关信息后,提示你选择一个力场:
力场包含了将要写人到拓扑文件中的信息。这个选择非常重要!
你必须仔细了解每个力场,并决定哪个力场最适用于你的体系。
在本教程中,我们选用全原子OPLS力场,因此在命令提示行中输入15,然后回车
上一条命令的其他参数:
pdb2gmx
程序还接受很多其他选项,下面列出常用的几个:
-ignh
:忽略PDB文件中的氢原子,对NMR结构非常有用,否则,如果存在氢原子,它们的名称和顺序必须与GROMACS力场中的完全一样,对氢原子存在各种不同的约定所以处理起来有时让人很头疼!如果你需要保留初始氢原子的坐标但需要重命名,可以试试Linux的sed命令-ter
:交互式地为N未端和C末端分配电荷态-inter
:交互式地为Glu(谷氨酸),Asp(天冬氨酸),Lys(赖氨酸),Arg(精氨酸)和His指定电荷态,选择涉及二硫键的Cys(胱氨酸)
现在你已经得到了三个新的文件1AKI_processed.gro
,topol.top
和posre.itp 1AKI_processed.gro
是GROMACS格式的结构文件,包含了力场中定义的所有原子即,已经将氢原子加到蛋白质中的氨基酸上了).topol.top
文件是体系的拓扑文件(稍后会解释)posre.itp
文件包含了用于限制重原子位置的信息(后面解释)。