Schrödinger中Ligprep小分子三维结构生成详解
1. Ligprep简介
LigPrep可以生成准确的、能量最小化的三维分子结构。LigPrep还应用复杂的规则来纠正Lewis结构,消除配体的错误,以减少下游的计算错误。
2. Ligprep详解(中文)
2.1 Usage
Usage:
ligprep [options] (-ismi|-icsv|-imae|-isd) infile (-osd|-omae) outfile
ligprep支持smiles
、 csv
、mae
、 sdf
等格式的输入,其中csv为保存为csv格式的smiles。并支持 mae
、 sdf
格式的输出。如果有转换其他格式的需求,可以使用shchrodinger中的很多convert小工具,类似jagconvert
、 mol2convert
、 pdbconvert
、 project_convert
refconvert
、 sdconvert
、 seqconvert
、structconvert
等。
General:
-h, -help 输出帮助信息(虽然不常看,但很有用)。
-long_help 输出更详尽的帮助信息 (估计很少用) 。
-inp filename 从提供的输入文件中读取参数。
-sif_docs 列出支持SIF文件格式的关键词。
例1:将smiles格式的输入文件,生成相关质子化状态的三维结构,将结果保存为Maestro格式。
ligprep -ismi input.smi -omae output.mae -epik
例2:通过参数文件提交ligprep作业
ligprep ligprep.in
参数文件ligprep.in
,定义了输入输出文件,小分子的力场、质子化、手性和生成的空间里构象数。
INPUT_FILE_NAME ligprep_A1.maegz
OUT_SD ligprep_A1-out.sdf
FORCE_FIELD 16
PH_THRESHOLD 0.0
EPIK yes
DETERMINE_CHIRALITIES no
IGNORE_CHIRALITIES no
NUM_STEREOISOMERS 1
2.2 Ionization(离子化)
Ionization:
-epik 使用epik进行电离和互变异构(推荐)。
-emb, -epik_metal_binding 使用metal_binding选项运行epik,这样也会生成适合与蛋白质结合口袋中的金属离子相互作用的状态。
-i {0,1,2} 电离处理。0表示离子化,1表示中和,2表示中和并离子化,默认为1。注意:-epik选项优先于-i
,总是进行电离和互变异构。
-ph number 有效的或目标pH值。
-pht number pH值,生成结构的最能耐受的pH。
2.3 Stereoisomers (立体异构体)
Stereoisomers:
-ac 不遵循现有的手性属性和输入文件中结构的手性,为所有手性中心生成立体异构体,数量不超过用-s选项指定的数目。默认只生成有明确指出的手性结构。
-g 在生成立体异构体时,根据输入文件的手性。
-s 每个输入结构最多生成的立体异构体数目,默认为32
。
2.4 Force-field based geometry optimization
Force-field based geometry optimization:
-bff {14,16} 小分子结构优化的力场,默认为14(OPLS_2005),16为OPLS3e力场。尽量用新的力场,一般来讲,越新的力场越准确。
2.5 Standard and job control options(标准化和作业提交选项)
Standard and job control options:
-NJOBS 将整个作业划分为NJOBS次作业。
-NSTRUCTS NSTRUCTS 将整个作业分成不超过NSTRUCTS结构的子作业。
-HOST hostname 在指定的主机上远程运行作业。
-WAIT 在工作完成之前不要返回提示信息。
-LOCAL 不要使用临时目录,而是将文件保留在当前目录中。
2.6 Typical usage (典型应用)
Typical usage:
对质子化状态和立体异构体进行采样,使用OPLS力场优化几何形状,并以Maestro格式存储结果:
ligprep input -omae outfile.maegz -epik
可支持的输入文件:
-ismi infile.smi
-icsv infile.csv
-isd infile.sd
-imae infile.mae
3. ligprep参数(原版)
ligprep -h
Usage:
ligprep [options] (-ismi|-icsv|-imae|-isd) infile (-osd|-omae) outfile
General:
-h, -help Print brief help message.
-long_help Print exhaustive help message.
-inp filename Read arguments from the supplied input file.
-sif_docs List supported simplified input file format (SIF) keywords.
Ionization:
-epik Use Epik for ionization and tautomerization (Recommended, overrides -i).
-emb, -epik_metal_binding Run Epik with the metal_binding option so that states appropriate for interactions with metal ions in protein binding pockets are also generated.
-i {0,1,2} Ionization treatment: 0 - do not neutralize or ionize, 1 - neutralize only, 2 - neutralize and ionize (Default: 1). Note that -epik option overrides -i and always implies ionization and tautomerization.
-ph number Effective/target pH.
-pht number pH tolerance for generated structures.
Stereoisomers:
-ac Do not respect existing chirality properties and do not respect chiralities from the input geometry. Generate stereoisomers for all chiral centers up to the number permitted (specified using the -s option). This is equivalent to “Generate all combinations” in the Ligand Preparation user interface. Default behavior is to respect only explicitly indicated chiralities.
-g Respect chiralities from input geometry when generating stereoisomers.
-s # Generate up to this many (#) stereoisomers per input structure. (Default: 32).
Force-field based geometry optimization:
-bff {14,16} Force-field to be used for the final geometry optimization. Default: 14 (OPLS_2005). For OPLS3e specify 16.
Standard and job control options:
-NJOBS NJOBS Divide the overall job into NJOBS subjobs.
-NSTRUCTS NSTRUCTS Divide the overall job into subjobs with no more than NSTRUCTS structures.
-HOST hostname Run job remotely on the indicated host entry.
-WAIT Do not return a prompt until the job completes.
-LOCAL Do not use temporary directory for job files. Keep files in the current directory.
Typical usage:
Sample protonation states and stereoisomers, optimize geometry using OPLS force-field, and store results in Maestro format:
ligprep input -omae outfile.maegz -epik
Where input is one of:
-ismi infile.smi
-icsv infile.csv
-isd infile.sd
-imae infile.mae