2022-Deep generative molecular design reshapes drug discovery-分子生成设计重塑药物发现

本文探讨了深度生成模型如何重塑药物发现过程,包括递归神经网络、变分自编码器、生成对抗网络、流基模型和强化学习在小分子和大分子药物设计中的应用。这些模型加速了药物开发,减少了成本,并通过生成具有特定属性的分子来优化药物设计。然而,也提出了数据质量和模型解释性的挑战,强调了未来研究的方向。
摘要由CSDN通过智能技术生成


随着科技的发展,人工智能(AI)和深度生成模型的最新进展和成就已经确立了其在医学应用中的实用性,特别是在药物发现和开发方面。为了正确应用人工智能,开发人员和用户面临着诸如要考虑哪些协议、要仔细检查哪些因素以及深度生成模型如何整合相关学科等问题。这篇综述是2022年10月发表在“Cell Resports Medicine”杂志上的,IF=16.988。这篇综述总结了经典和新开发的人工智能方法,为广泛的计算药物发现和开发社区提供了更新且易于访问的指南。从不同角度介绍了深度生成模型,并描述了表示化学和生物结构及其应用的理论框架。讨论了数据和技术挑战,并强调了多模态深度生成模型的未来方向,以加速药物发现。

药物发现中的深度生成模型

最近的一项研究估计,制药公司在2年花费了6亿美元用于开发美国食品和药物管理局批准的新药,高于2015年的802.2003亿美元。尽管在临床试验期间会产生更多的直接成本,但由于临床前投资来得更早,因此两个阶段的资本化成本大致相等。计算科学和技术的最新进展抓住了必要性和紧迫性,并提供了一套潜在的有前途的方法。其中,开发人员可以选择正确的人工智能(AI)来针对手头的问题,特别是深度生成模型,适当的协议和因素。总的来说,他们绘制了整合生物学、化学、计算科学、药理学和疾病治疗的路径。计算能力、数据量和高级算法的快速增长导致了人工智能在药物发现方面的突破,特别是在深度生成模型的应用中。这些模型已成为改变小分子和大分子设计、优化和合成的高潜力工具(图 1)。

深度生成模型的应用已经提供了新的部分优化的候选线索,在某些情况下,传统顺序方法通常需要更短的时间。如果大规模应用,深度生成建模有可能促进开发(R&D)过程。

图 1 药物发现管道中的 AI 和深度生成模型应用

图 1 药物发现管道中的 AI 和深度生成模型应用

深度生成模型对应于一个理论框架,该框架使用数据结构(例如图形和指纹)以及操作(例如功能或实验信息流)生成具有所需特性的新型化学和生物结构。创造性的深度生成模型可以显著促进算法在药物发现中的开发和应用。在这个“大数据”时代,深度生成模型将提供一项尖端技术,可以彻底改变生物学、疾病和治疗学的信息学观点。在本综述中,我们描述了经典和最先进的深度生成模型及其在计算药物发现中的应用(图1),并讨论了局限性和挑战。我们的目标是概述小分子和大分子系统上多种应用中深度生成模型的当前工具和技术(工具箱)。

化合物/分子的表示

分子的表示对于生成模型很重要。有三种类型的表示:(1)基于序列,(2)基于图形和(3)图像(图2)。

自然语言处理(NLP)的空前成功激发了以类似于人类语言的方式描述符号分子的想法。生物结构中的语义和语法与人类语言相似;因此,分子可以表示为字符序列。从头小分子设计通常使用简化的分子输入线输入系统(SMILES)。基于序列的结构是按照编码到向量的 SMILES 语法规则生成的(图 2A)。

表示分子的更直接方法是基于图。在图形表示中,小分子的原子形成一组节点,键被视为边缘(图2B)。对于大分子,接触图是表示任何两个氨基酸残基对之间距离的图表。然而,基于序列和基于图形的方法都无法捕获具有生物学意义的配体-蛋白质相互作用中配体或蛋白质的3D信息。

分子的3D构象捕获原子的相对取向 (图2C). 还展示了几种最新的 3D 表示。
请添加图片描述
图2 三种分子表示方法示意图

DEVELOP结合了现有的基于图形的深度生成模型De-Linker以及卷积神经网络,以利用分子和目标药效团的3D表示。DeepLigBuilder是一种基于图形的生成模型,它利用配体-受体相互作用的3D结构表示来端到端设计具有药物相似特性的化学和构象有效的3D分子。蛋白质的传统图像或3D表示需要来自冷冻电子显微镜和晶体学的精确3D结构数据,这很难获得。最近的人工智能方法,如AlphaFold2,可以提供大量的蛋白质3D数据来应对这些挑战。

Deep Generative Models

请添加图片描述

图 3 药物发现应用中五种深度生成模型 (A–E) 的理论框架的图表

递归神经网 RNN

递归神经网络 (RNN) 是处理人类语言的生成神经网络的基本组成部分。它们对于具有顺序或时间分量的系统进行建模非常有用,并且在NLP自动计算机代码生成方面非常强大和音乐创作。分子的语言,如微笑,类似于人类的语言。因此,使用RNN来生成基于顺序表示的分子是很自然的。

如图 3A 所示,(即“c1cc …c1“)可以通过以下方式由RNN生成。RNN 接收第一个字符“c”,并为可能的下一个字符分配不同的概率:字符“1”将获得很高的概率,并且可以作为下一个字符进行采样。“1”是RNN的反馈输入。重复此过程,直到生成结束标记“\n”。

长短期记忆和门控循环单元 (GRU)引入一种门机制来记住一长串步骤的有价值的输入信息,这是传统 RNN 所缺乏的。LSTM或GRU是否可取可能取决于具体的应用。LSTM单元可以比GRU保存更长的历史。是,LSTM 中的其他参数可能会增加过度拟合的风险。具有LSTM或GRU的RNN是最有希望在SMILES代表下产生从头小分子的RNN。

变分自动编码器 VAE

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值