AI&化学
文章平均质量分 83
AI在化学中的应用
仰望星空_5
在线求职
展开
-
论文笔记|基于副产物的单步逆合成预测
图b显示了选择过程。通过分析目前一些模型的top-1结果,作者发现当化合物具有多个潜在反应中心时,直接预测的模型倾向于做出简单的预测,而逃避复杂的预测;对于RPBP,如果没有人工干预,也就是直接将第一阶段模型预测的副产物输入到第二阶段模型中来预测反应物, RPBP 和 GraphRetro对于氢化获得产物的偏好是一致的。至于解码层,则是根据上面的图的表示预测可能的副产品和相应的概率。另外,由于RPBP的预测精度受到第一阶段副产物预测的极大限制,未来的工作可以通过融合反应中心的信息来进一步提高模型的性能。原创 2023-09-25 17:34:19 · 239 阅读 · 0 评论 -
默克AI逆合成软件的一点细节(六)
在 n 个合成步骤内,有约 100n 条可能的途径通向所需的目标——即使对于相对较短的合成,如此数量的可能性也太大,无法以详尽的方式探索。避免这种复杂化的唯一方法是教会机器以智能的方式搜索合成可能性的空间,并将搜索引导向最有效、最优雅的步骤序列,而不是探索整个可能的合成路线。除了可以自定义分子,用户还可以进一步指定终端节点的属性,例如分子量(“继续合成搜索,直到找到分子量低于特定阈值的终端节点”)或价格( “仅当每克可购买基材的价格低于指定阈值时才停止”)。而且,最短的合成路线也不一定是成本效益最优的。原创 2023-09-24 20:27:28 · 169 阅读 · 1 评论 -
默克AI逆合成软件的一点细节(五)
我们知道现实的有机反应是非常复杂的,即使尽我们所能最细致的编写分子背景和反应规则也不能确定模板在任何情况下的适用性。所以除了尽可能充分详细的编写模板外还需要另外编写一些策略帮助模型选出尽可能正确的模板,或者说减少一些错误的和具有迷惑性的逆合成子。这些逆合成子对于化学家来说很容易就能判断是否能生成产物,但对于机器来说可能是比较难判断的。1.原创 2023-09-22 22:30:19 · 190 阅读 · 1 评论 -
默克AI逆合成软件的一点细节(四)
因为根据具体的反应条件,要保护的基团可能需要使用不同的保护基团。反应条件我们可以从模板内反应条件编码中直接提取,不同的编码表示不同的反应条件,例如“WL62”表示“硫醇亲核试剂”,“CB65”的条件代表软路易斯酸。第二步:检查合成子的其余部分是否存在不相容的基团或者需要保护的基团。检查到相关的基团后会报告给用户,并把应用改模板的反应标记为低可能性的反应,路线自动规划时也给与较低的分或者不采用。然后对照反应条件和保护基团相容性对照表却找合适的保护基团,对应图中就是第26列第2、4、6行。原创 2023-09-22 09:49:10 · 73 阅读 · 1 评论 -
默克AI逆合成软件的一点细节(三)
反应模板包含下面几类信息:模板名字、反应符号标记(SMARTS)、反应条件的分类、典型的反应条件,需要保护的基团、不兼容的基团列表、参考文献。原创 2023-09-22 09:47:53 · 122 阅读 · 1 评论 -
默克AI逆合成软件的一点细节(二)
基于上面提到的几个因素以及一些其他因素(例如及其缺少负样本数据),机器自动提取反应模板的方法在一些简单常见的反应中表现还可以,但在复杂的更新的反应中表现和人类相比有巨大的差距。用距离核心原子的化学键数作为衡量反应中心的距离大部分情况是准确的,但是在三维空间内超过n个化学键的基团仍然有很大的可能会影响反应核心(例如,SN2、Wittig 等)。下图是远程基团影响的另外一种情况。相比于图c的消旋产物,图a因为受到棕上立体构型的基团 CH2OMe的影响,产物也是立体选择性的,这是远程基团空间效应的表现方式。原创 2023-09-20 15:26:59 · 196 阅读 · 1 评论 -
默克AI逆合成软件的一点细节(一)
2. 缺少能够规划(组合)出好的合成路径的算法,使总的合成代价最低且符合人们的需求。在SYNTHIA™的10万多个模板中每条模板的核心都是一个决策树,如图 1A 中所示的决策树,用于带有手性中心的酯与手性中心的醛的缩合。为了确保产物的构型正确,考虑了第一个原料的位置#8、#1和#3的取代基,以及第二个原料的位置#12的取代基、#2和#11的手性结构、#14的原子情况。除了要避免错误外,理想的合成路线还需尽可能符合人们对高效、低成本的期望,这就需要对提取的路线进行打分,根据分数的高低判断路线的优劣。原创 2023-09-19 22:03:53 · 257 阅读 · 0 评论