JCIM | 一种考虑受体结构的从头药物生成方法-SBMolGen

2021年,Biao Ma等人在JCIM期刊上发表了一篇名为**“Structure-Based de Novo Molecular Generator Combined with Artificial Intelligence and Docking Simulations”**文章。介绍了一种考虑受体结构的从头药物生成方法。

方法

此方法灵感来源于2017年的一篇**“ChemTS: an efficient python library for de novo molecular generation”**,文章提出了将RNN模型与MCTS(蒙特卡洛树搜索法)组合使用以产生全新结构的化学分子。

  • RNN模型:即循环神经网络。每个化学分子都可以写成由字符组成的SMILE格式,同样的每个SMILE字符串也可以转为化学分子。由此人们很自然地想到使用擅长语言学习的RNN模型产生全新的SMILE式。
    如苯环的SMILE式为‘C1=CC=CC=C1’,如果这时有一个训练好的RNN模型,这时我输入"C1=",那么该模型估计下一个字符大概率为“C”,再接着是“C”,然后是“=”,“C”,“C”,“=”,“C”,“1”。这就像是有一双无形的手推动着字符串向后延伸。
  • MCTS:如上图所示,MCTS包含四个过程,分别是“Selection”, “Expansion”, “Simulation”, “Backpropagation”。“Selection”就像是我们“喂”给RNN模型的引子,“Expansion”就是借助RNN模型的推动力将这个引子延续下去,“生长”下去。但这种生长不能是无序的,否则生成的分子性质不能满足我们的需求,因此需要在“Simulation”这一步对生成的分子进行品质验证。比如我想看看它们能否和目标受体结合稳固,能否有更好的logP,能否满足类药五原则等;在验证之后,将验证结果在“Backpropagation”这一步反馈给“Expansion”这一步,调整各个延伸结点所占权重,重新生成新的分子。就这样重复几轮就能得到需要的分子了(下图的描述更直观了一点)。

step1相当于MCTS中的“Selection”, “Expansion”;
step2step3相当于MCTS中的“Simulation”;
step4相当于MCTS中的“Backpropagation”。


结果

在C取值不同的情况下,生成分子收敛情况。C值越小收敛越快,可能由于C值越小降低了生成分子的多样性(从获得先导化合物的角度来讲,还是希望能获得的分子更具多样性,因此C应取大一点)。这里文章中没有解释参数C的含义,不过我在代码中找到了参数C在“Selection”环节中有所出现,应该是控制第一步选择结点数量,C数值越大则选择的结点越多,那么产生的分子骨架也越多样。

灰色点表示训练的分子集,彩色点表示不同时间生成的新分子。当C值越大时,新分子的分布范围越广,对化学空间的探索性更大。

不同受体,在C取值不同的情况下,生成的分子与靶向各受体的阳性药的相似性系数Tanimoto分布。很明显的越晚生成的分子与阳性药的相似性更高。

不同受体,在C取值不同的情况下,生成的分子可合成性分布情况(SA是定量评估分子合成难易程度的数值,取值1-10,越靠近1表明越易合成)。整体均小于3.5,当C取值1时,明显向数值更小的区间转移。

不同受体,在C取值不同的情况下,生成的分子类药性分布情况。(QED是定量评估类药性的数值,取值0-1,越靠近1表明成药性越好)

C取值不同的情况下,生成的分子与受体对接打分分布情况。显示SBMolGen好于GENTRL(一种使用对抗神经网络进行药物从头设计的方法)。

The interfragment interaction energy(IFIE)与实验测定的蛋白配体结合能显现良好的相关性(结合能与解离常数转换关系ΔG =−RT·ln(1/Kd));且随着SBMolGen运行时间延长,越晚生成的分子IFIE更小,意味着与蛋白结合更强。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

药研猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值