并非所有的代码路径都返回值_并非所有LogP都平等:CLogP的故事

原文地址:

Not all LogP’s are calculated equal: CLogP and other short stories​sussexdrugdiscovery.wordpress.com
c623e3213a20f9336ddd329c534802cf.png

发表于 2015年2月3日

作者 pbeswick


材料的分配系数(logP)定义了它在两种不混溶的溶剂中的溶解度之比–尽管我们通常使用辛醇:水,但它可以是不混溶的流体的任意组合。此属性是遍及ADMET各个方面的化学描述符之一,用于过滤和定义要在其中工作的化学空间。奇怪的是,对于如此重要​​的属性,大多数项目和程序都建立在从未通过实验确定LogP的材料上:依赖于软件生成的预测值。


最近,我们的DMPK科学家提出了一系列预测的logP值他在实验室中专业确定的值。尽管在许多情况下相关性很好,但存在一些明显的异常值,所以他来问我,化学计算家,看看我是否可以解释为什么计算的logP如此不同。有一些明显的结构特征可能会误导某些计算logP的方法-是的,不止一种计算logP的方法-在我们的情况下,其他方法可能会更精确地预测离群值。并非所有LogP均等于
当化学家谈论ClogP时,他们通常会错误地指“计算出的” logP。对于CADD科学家而言,ClogP意味着不同的东西– ClogP是用于预测logP的专有方法(由BioByte Corp./Pomona College拥有)。尽管有多种预测方法,但有三个基本类别,并且当前的绝大多数方法都是其特色:原子例如 “ AlogP”,)和增强型原子 /混合原子(“ XlogP”,“ SlogP”)片段/化合物(“ ClogP”,KlogP,ACD / logP)基于属性的方法(“ MlogP”,“ VlogP”,“ MClogP”,“ TlogP”)原子 logP认为每个原子对logP都有贡献,并且化学实体的最终值纯粹是加和的。"http://pubs.acs.org/doi/abs/10.1021/ci00053a005">Crippen 等。最早在80年代后期的一系列论文中提出了这种方法,改进后的版本称为“ AlogP”。1该方法实际上是对每个原子进行表格查找,并且有许多免费的AlogP计算器可用。它适用于较小的分子,特别是具有非复杂芳香性的分子或不包含对logP产生意外贡献的电子系统的分子。增强型原子或混合logP(XlogP,SlogP )是AlogP系统的修改–试图解决原子方法对大型系统的缺点,它采用了每种原子类型的价值以及其邻居的贡献以及有助于在纯原子方法中回避已知偏差的校正因子。这是尝试允许更大的电子效果。它是一种快速的查表技术,许多免费软件也使用此方法。聪明的混合算法知道每个原子的状态,并因此知道其邻居增加了多少贡献。片段/复合logP是一种方法,它使用实验确定的完整化合物或片段的数据集,然后使用QSPR或其他回归技术对小片段而不是每个原子进行建模。然后将片段贡献与校正因子相加。这里的基本原理是,有时原子方法无法充分地模拟电子或分子间相互作用的细微差别,而使用完整的片段可能会更好地对其进行模拟。对于具有复杂芳香性和较大分子的系统,此方法倾向于更好-条件是该分子包含的特征与进行建模的特征相似。如果您的分子中的主题非常模糊,则用于进行预测的模型可能没有很好的相关性。基于属性的方法…
使用属性,经验方法,3-D结构(例如,连续溶剂化模型,MD模型,分子亲脂性)和拓扑方法,可以找到用于确定logP的大量方法。这些方法大多数都在计算上相当密集,并且埋藏在信息学和统计数据的世界中,但是其中一个值得或特别注意的是:Moriguchi的方法(或MlogP),使用亲脂性原子的总和和亲水性原子的总和作为方法。回归模型中的两个基本描述符,能够解释1230种化合物数据集的实验确定的LogP值中近75%的方差。2该小组后来添加了11个校正因子,该模型解释了91%的方差。它非常快,因此从历史上看,它已被用于大型数据集,并被包括在多个属性预测软件中,例如Dragon和ADMET Predictor(Simulations Plus,Inc.)。如今,随着计算速度的提高,MlogP的使用越来越少,因为即使在大型库中,更精确的方法也变得易于管理。

那么,使用哪种方法?
Biovia的Pipeline Pilot和Discovery Studio具有AlogP版本,而Knime具有多个免费的X和A logP计算器插件。CCG的MOE使用未发布的原子模型(Labute)和混合SlogP。DataWarrior使用ClogP,Dotmatics / Vortex本机使用XlogP,但是您可以修补其他内容。Cresset BMD的产品使用SlogP,而Optibrium的StarDrop使用片段方法。ChemAxon使用多种方法(包括杂交体(VG)和片段例如 KlogP),如果您在Knime中拥有其InfoCom节点,则可以使用多种方法并根据您的理解对其加权,或者更好的是,您可以对系列中具有已知数据的方法进行快速相关性检查(如果小组有资源通过实验确定您自己的一些LogP,然后相应地对模型进行加权。

作为规则(有例外):

简单的小分子例如片段大小)– AlogP可能效果很好,但使用混合方法会更好。

复杂但标准的小分子(药物化学家喜欢的正常发育类型),因此片段/化合物logP方法通常是最准确的。混合方法是您的第二个最佳选择(但仍然相当不错)。

复杂的非标准分子(具有很少的基序),然后是混合系统或基于片段的logP可能同样好(或不好),这取决于片段logP所基于的模型。您还可以让您的团队通过实验确定一些内容,看看您是否无法建立模型……
有关许多最新技术和经典方法的统计见解以及它们在大型实验确定的数据集中的表现如何,请参阅Mannhold 等的论文3


因此,总而言之,并不是所有的logP预测模型都是相同的,并且有时某些模型的准确性会超过其他模型,具体取决于您的化学反应。希望现在您至少能够在小组会议上解释为什么预测的logP偏离了目标…
参考文献:

  • Ghose, A.K.; Crippen, G.M. Atomic physicochemical parameters for three-dimensional-Structure directed quantitative structure-activity relationships. 2. Modeling dispersive and hydrophobic interactions. J. Chem. Inf. Comput. Sci. 1987, 27, 21–35.
  • Moriguchi, L.; Hirono, S.; Liu, Q.; Nakagome, I.; Matsushita, Y. Simple method of calculating octanol/water partition coefficient. Chem. Pharm. Bull. 1992, 40, 127–130.
  • Mannhold, M. et al. Calculation of Molecular Lipophilicity: State-of-the-Art and Comparison of Log P Methods on more than 96,000 compounds. J. Pharm. Sci. 2009, 98, 861-893.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值