Molecular Sets(MOSES): A Benchmarking Platform for Molecular Generation Models,AI制药领域,分子生成必读文章

MOSES是一个用于评估和比较分子生成模型的基准平台,涉及深度学习和生物医学应用。它提供了多种分子表示方法,如SMILES、DeepSMILES、SELFIES和InChI,并设立了一系列评判标准,包括valid&unique、Novelty、Filters、Fragment similarity、Scaffold similarity、Similarity to a nearest neighbor、Internal diversity、Fréchet ChemNet Distance和Properties distribution。此外,文章介绍了数据集的构建过程,经过一系列过滤得到约194万个分子的最终数据集。
摘要由CSDN通过智能技术生成


在这里插入图片描述

1 研究背景

深度学习模型在生物医学领域得到广泛应用,目前有很多分子生成模型,但不清楚如何对它们进行排序和比较,因此作者引入了一个称为MOSES的基准测试平台。
文章提出的平台MOSES是一个基准平台,用来标准化分子生成模型的训练过程,并对不同的模型进行比较。MOSES提供了训练集和测试集,并提供了一组用于评估生成的分子质量和多样性的指标,同时MOSES已经实现并比较了几种模型。
文章代码可在github中获得:https://github.com/molecularsets/moses

2 分子表示方法

2.1 字符表示

SMILES:最常用,以深度一阶遍历分子图的生成树,并存储原子和边标记。SMILES还使用特殊标记来表示未被生成树覆盖的分支和边。
DeepSMILES:是SMILES的扩展,通过改变 分支和环闭包 的语法来减少无效序列。
SELFIES:在Chomsky type-2基础上增加了自引用函数。SELFIES通过将分支和环的信息分开保存,可以做到比较好的表现力。
InChI:国际化学标识符,是一种更详细的字符串表示法,明确指定了化学式、原子电荷、氢和同位素。

2.2 分子图表示

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值