2018 Journal of cheminformatics | 基于条件变分自编码器分子生成模型

最新推荐文章于 2022-12-08 20:40:43 发布

发呆的比目鱼

最新推荐文章于 2022-12-08 20:40:43 发布

阅读量968

点赞数 1

分类专栏： DrugAi 生成模型文章标签：机器学习人工智能深度学习

本文链接：https://blog.csdn.net/weixin_42486623/article/details/126700604

版权

DrugAi 同时被 2 个专栏收录

186 篇文章

订阅专栏

生成模型

11 篇文章

订阅专栏

本文介绍了2018年Jaechang Lim等人的研究，他们提出基于条件变分自编码器（CVAE）的模型，用于从头设计分子，能调整特定属性保持其他属性不变。文章展示了CVAE在生成类药物分子和调整目标特性方面的效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

2018 Journal of cheminformatics | Molecular generative model based on conditional variational autoencoder for de novo molecular design

Paper：https://jcheminf.biomedcentral.com/articles/10.1186/s13321-018-0286-7
Code：https://github.com/jaechanglim/CVAE

基于条件变分自编码器分子生成模型

本论文由Jaechang Lim等人 2018年发表于化学信息学杂志，其主要工作是提出了一种基于条件变分自编码器的分子生成模型，用于从头设计分子。证明它可以用于生成具有五种靶标性质的类药物分子。并且能够在不改变其他属性的情况下调整单个属性。

模型

条件变分自动编码器 (CVAE)

首先，作者阐明 VAE 和 CVAE 之间的区别，它们的目标函数相互比较。VAE 的目标函数由下式给出：

$\begin{aligned} E[\text {log}P(X|z)]-D_{KL}[Q(z|X)\parallel P(z)], \end{aligned}$

其中 $E$ 表示一个期望值， $P$ 和 $Q$ 为概率分布，DKL为Kullback-Leibler散度， $X$ 和 $z$ 分别表示数据和潜在空间。第一项和第二项通常分别称为重建误差和 KL 项。CVAE 与 VAE 的一个关键区别在于将条件信息嵌入到 VAE 的目标函数中，从而得到修改后的目标函数如下：

$\begin{aligned} E[\text {log}P(X|z,c)]-D_{KL}[Q(z|X,c)\parallel P(z|c)], \end{aligned}$

其中c表示条件向量。条件向量c直接参与编码和解码过程。

CVAE 模型与联合训练的 VAE 模型的主要区别在于，分子特性直接合并到编码器和解码器中。两部分组成：

用于目标分子性质，
涉及分子结构和其他性质。

分子表示和模型构建

用 SMILES 代码表示分子，以利用专门处理文本和序列的最先进的深度学习技术。每个 SMILES 代码都被规范化为一个独特的分子表示。

数据

ZINC 数据集,

结果

CVAE 生成的分子，其条件向量由a阿司匹林和b达菲的五个目标特性组成。

由 CVAE 生成的分子，其条件向量由阿司匹林的五个目标特性组成，潜向量由阿司匹林的潜向量稍作修改。图中显示结果，从阿司匹林以这种方式产生的分子。它们看起来与阿司匹林非常相似，并且在 10% 的误差范围内也具有与阿司匹林相似的特性。