题目: Transformer Performance for Chemical Reactions: Analysis of Different Predictive and Evaluation Scenarios
文献来源:https://doi.org/10.1021/acs.jcim.2c01407 (JCIM)
代码:https://github.com/albornet/chempred_revision.
简介:随着基于深度学习范式的新型机器学习架构的发展,加速了化学反应途径的预测。在这种情况下,最初为语言翻译而设计的深度神经网络已被用于准确预测广泛的化学反应。在适合语言翻译任务的模型中,最近引入的分子Transformer在正向合成和后合成预测方面取得了令人印象深刻的性能。在本研究中,作者首先分析了在不同的数据可用性和数据增强场景下,产品、反应物和试剂预测任务的Transformer模型的性能。作者发现,数据增强的影响取决于预测任务和用于评估模型性能的度量。其次,作者探讨了不同的输入格式组合、标记化方案和嵌入策略对模型性能的贡献。他们发现,较不太稳定的输入设置通常会导致更好的性能。最后,作者使用一个人类专家委员会,验证了round-trip准确性优于更简单的评估指标,如top-k准确性,并显示了通过round-trip测试的预测的强烈一致性。这证明了更详细的指标在复杂的预测场景中的有用性,并强调了直接与预定义的数据库进行比较的局限性,其中可能包括有限数量的化学反应途径。
主要内容:
-------------------------------------------
欢迎点赞收藏转发!
下次见!