论文解读:《自动配体搜索器的介绍》

文章地址:https://pubs.acs.org/doi/10.1021/acs.jcim.3c01317
DOI:https://doi.org/10.1021/acs.jcim.3c01317
期刊:Journal of Chemical Information and Modeling
2022年影响因子/分区:5.6/二区
发布时间:2023年11月20日

1.文章概述

自动配体搜索器 (The Automated Ligand Searcher,ALISE)被设计为自动计算药物发现工具。为了估算配体与受体的结合自由能,ALISE 包括一个三阶段工作流程,每个阶段都涉及复杂的计算方法:分别是分子对接、分子动力学和自由能扰动。为了缩小潜在配体的数量,性能较差的配体被逐渐隔离出来。 ALISE 的性能和可用性以包含已知的 HIV 蛋白酶活性配体和诱​​饵的案例研究为基准。该示例说明 ALISE 成功过滤了诱饵,并表明该软件的自动化、全面性和用户友好性使其成为改进和加快药物开发工作流程的宝贵工具。

2.背景

在有记录的时间里,致命疾病和相关流行病的出现一直是一个反复出现的现象。然而,随着过去几个世纪人口的迅速增加以及随之而来的人与人以及人与动物的接近程度的增加,流行病变得越来越频繁。此外,由于国际旅行,疾病很容易在各国之间传播,导致全球大流行,例如艾滋病毒大流行和最近的 2019 年冠状病毒病 (COVID-19) 大流行。疾病暴发给人类生命和全球经济带来巨大代价。例如,迄今为止,COVID-19 造成的死亡人数超过 6.887 万人,并有望大幅削减世界GDP。因此,至关重要的是,改进和加快当前用于抗击疾病的协议,例如检测方法、疫苗和药物的开发。
本文重点介绍药物发现方法的改进建议。药物发现的目标是找到与靶标(受体)结合的分子(配体),通常是蛋白质,并通过配体-受体相互作用,阻断或调节特定的生物分子机制或途径。在传染病的情况下,通常针对对病原体的生存或繁殖至关重要的机制。
将一种药物推向市场的平均成本估计为 ∼1 亿美元。临床试验的毒性测试是药物开发中成本最高的部分(∼20%)。此外,据估计,在药物开发过程中合成或分离的分子中,只有0.01%被批准为药物。因此,开发新药的巨额成本主要是由于在研究不成功的候选药物上花费的金钱和时间。
为了在药物开发过程的早期改善对不良候选药物的识别,从而优化发现成功药物的效率,将计算方法作为初始药物发现的一部分已成为一种普遍做法。分子对接(docking)是计算机辅助药物设计中一种成熟的方法,它确定了受体中配体的最佳结合位点,并根据其计算出的结合亲和力为其分配分数。现有的计算对接程序可以快速筛选数千个配体,但代价是建模水平相当粗糙。最严重的局限性是配体中只有有限数量的化学键是柔性的,并且受体通常被建模为静态或只有少数柔性残基。这种高度受限的构象搜索空间可能导致对结合亲和力的估计不佳。为了改进计算机辅助药物设计,需要应用更精细的方法。
在本文中,作者提出了三阶段自动配体搜索器(ALISE)程序,通过在每个阶段应用越来越精细的计算方法,缩小了潜在候选药物的数量。第一阶段应用可以说是原始但快速的对接方法,丢弃除最有前途的配体之外的所有配体。需要注意的是,由于所有配体最初都是在对接阶段筛选的,因此整个工具对对接算法的结果高度敏感。对于手头的案例研究,在分子动力学 (MD) 阶段仅计算了 100 个配体,占完整配体组的不到 0.3%。剩余的配体进入第二阶段,在该阶段进行MD模拟以获得对配体与受体之间相互作用的详细见解。使用从MD模拟中获得的结合自由能估计值,具有最强表观结合自由能的配体进入第三阶段,通过高级自由能微扰(FEP)模拟获得更精细的结合自由能估计值。
为了使ALISE的优势尽可能容易获得,ALISE在多功能的网络平台中作为计算任务实现,它提供了标准化的分步工作流程,用于设置和链接各种计算建模技术,例如 MD 模拟、FEP 模拟、各种量子力学 (QM) 计算等。此外,VIKING连接到超级计算集群,并允许人们在高性能计算资源上无缝运行任何任务。
过去,ALISE的早期原型版本已成功用于研究严重急性呼吸系统综合症冠状病毒2(SARS-CoV-2)中的配体-受体结合。此外,ALISE框架可用于在结构上比较不同的受体模型及其配体亲和力。在下文中,概述了构成ALISE中每个阶段基础的理论和方法,并介绍了ALISE工作流程本身。此外,使用HIV蛋白酶证明了ALISE的能力,DUD-E数据库为该蛋白酶提供了一组活性和诱饵配体的基准。ALISE在大量诱饵中寻找少量活性配体的性能被量化。

3.数据

DUD-E数据库包含活性配体和诱饵配体的组合,前者是生物活性分子或与靶蛋白相互作用并表现出所需药理作用的化合物,后者是分子对接实验中作为阴性对照的非生物活性分子。使用来自 DUD-E 数据库的数据集,可以评估对接算法是否有效地识别活性配体,而不会错误地包含诱饵配体。

4.方法

ALISE 通过三个连续阶段从一系列候选药物中识别出针对特定受体的最佳候选药物:分子对接、MD 和 FEP。图 1 提供了如何在每个阶段采用日益复杂的建模方法来计算假定的配体-受体复合物的结合自由能的示意图,特别是分子对接、MD 和 FEP 模拟,如图中命名的三个阶段所示。配体的估计结合自由能被称为其分数,并且在各自的阶段获得单独的分子对接、MD和FEP分数。在每个阶段结束时,仅选择得分最高的配体进入下一阶段。每个阶段中配体的逐渐分离确保了不会通过应用计算成本更高的方法来研究较差的候选药物而浪费计算资源。
在这里插入图片描述

3.1 分子对接

分子对接是一种建模方法,用于确定最佳结合姿态,即配体在受体结合位点的位置、构象和取向,以及测量配体与受体在确定的结合姿态下的结合亲和力的对接评分。

3.2 分子动力学

ALISE的第二阶段基于使用NAMD进行的平衡全原子MD模拟确定所研究配体的结合自由能。与分子对接相反,所考虑系统的所有部分都允许在MD阶段移动。原子运动是通过将每个原子的牛顿第二定律与从实验研究和 QM 建模中获得的分子力学(MM)力场得出的原子间力积分来获得的。因此,MD阶段对配体-受体结合过程提供了更详细和更真实的描述。

3.3 自由能扰动

在ALISE的最后阶段,使用FEP计算最有希望的配体的结合自由能估计值。FEP 也基于 MD 模拟,但除了在 MD 阶段仅模拟绑定和未绑定状态的系统外,还模拟了几个中间状态。
在这里插入图片描述

3.4 ALISE的计算实现

在这里插入图片描述
网络平台 VIKING(16)提供对ALISE软件的访问,该软件提供了一个用户友好的工作流程界面,类似于VIKING中的其他计算任务。为了设置虚拟筛选实验,系统会提示用户提供特定信息。如图 3 所示,步骤 A-C 需要以下信息:

  1. 靶受体:用户可以上传受体的分子结构文件或提供蛋白质数据库(PDB)ID,以自动搜索数据库中的受体。
  2. 配体:潜在的配体可以作为分子结构文件上传,或者系统可以从 PubChem 数据库中自动检索它们。通过化学相似性搜索。相似性通过 Tanimoto 评分进行评估(参见支持信息:PubChem 上的化学相似性搜索)。通过使用工具包,可以对可能的毒性进行额外筛查,计算药物相似性的定量估计,并将其输出作为 mol2 文件列表上传。
  3. 搜索空间:用户可以手动设置搜索空间的尺寸和位置,也可以使用 VIKING 中的图形用户界面拖动搜索空间框。或者,ALISE可以使用AutoLigand软件自动确定搜索空间(参见支持信息:AutoLigand)。

完成这些初始步骤后,用户将进入一个摘要页面(图 3 中的步骤 D),在该页面中可以查看和调整所有设置,包括特定于虚拟筛选实验中使用的三个阶段中每个阶段的设置。默认情况下,所有设置都设置为合理的值。但是,专家用户可以灵活地调整 ALISE 的几乎每个方面。值得注意的是,可以调整对接详尽性和仿真参数,例如MD和FEP级的仿真长度、时间步长和输出频率。此外,可以改变FEP阶段要模拟的中间炼金术态的数量,以控制所获得的自由能估计值的统计可靠性。用户界面中所有可用设置的详细说明可在支持信息(虚拟屏幕设置选项)中找到。
从VIKING平台上的任务摘要页面开始寻找合适的药物分子。然后,VIKING启动虚拟放映,并自动处理步骤之间的过渡。可以在概述页面上监视正在运行的实验的进度(参见图 3 中的步骤 E),从中还可以获得中间结果和文件。演示在 ALISE 中设置任务的过程的屏幕截图可以通过数据和软件可用性声明找到。图 4 概述了 ALISE 在执行任务时处理的自动化工作流程。首先,如果需要,从 PubChem 数据库中获取配体(52,53)之后,使用AutoDockTools准备受体和配体文件以进行对接(61)和 OpenBabel。(62)接下来,如果需要,使用AutoLigand确定合适的搜索空间。(55)对接由 VinaMPI 执行(25)结果页面上显示了用户定义的最佳得分配体和姿势数量,参见图 3 中的步骤 F。

在这里插入图片描述
对于对接阶段的每个性能最佳的配体,Charmm 通用力场 (CGenFF) 程序自动生成一组 MM 力场参数,并基于确定的结合位姿,制备并启动采用隐式溶剂近似的MD模拟。
在最后阶段,使用显式溶剂模型,根据从MD阶段获得的性能最佳配体的最后构型制备和执行FEP模拟。

5.结果

5.1 性能

作者使用 HIV-1 蛋白酶的 DUD-E 数据集来对 ALISE 的性能进行基准测试,以确定与随机选择相比,该程序是否能够为蛋白酶鉴定出更具有活性的配体。此外,作者还比较并讨论了所涉及的三个不同步骤:对接、MD 和 FEP。
本研究中使用的数据集包括 1,395 个活性配体和 35,750 个诱饵。ALISE旨在对这些配体进行分类,偏向于活性配体。在每个步骤中,ALISE都会根据配体的分数生成配体的有序列表,得分最高的配体将进入下一阶段。未能对接或被模拟的配体被列为最差的配体。失败的可能原因包括当VinaMPI无法将配体拟合在定义的结合位点时,对接不成功,CGenFF无法产生参数,或不稳定的MD模拟。后者只发生过一次,是由非物理参数引起的,导致突然和大的加速度。具体参数涉及硫原子,CGenFF为其分配了约100分的大惩罚分数。在每个阶段,都会评估ALISE的性能,并将其与从数据集中随机选择的配体进行比较。如果图 5D-F 中所示的积分为正,则 ALISE 优于随机选择。
在这里插入图片描述

5.2 对接结果

在ALISE中实施的工作流程允许将与HIV蛋白酶结合的推定配体数量从35,750个减少到仅15个。以下部分对程序的 FEP 阶段提供的排名最高的前三个配体进行了更详细的检查。
根据 DUD-E 数据库,总体排名最高的配体是诱饵。它的结合自由能估计为−42.60 kcal/mol,如图6所示。这种诱饵配体尚未经过实验研究或提及具有某些效果。因此,可能是配体在性质上不够稳定,或者没有经过充分研究以得出任何明确的结论。当然,也有可能已经发现了一种新的抑制HIV蛋白酶的推定药物。配体的分子结构如图7A所示。
在这里插入图片描述
在这里插入图片描述
排名第二的配体 (PubChem CID 471313) 具有与第一个配体相似的结合自由能估计值,值为 −40.02 kcal/mol。配体的结构如图7B所示。对于排名第三的配体,ALISE获得了−31.89 kcal / mol的结合自由能估计值。由 DUD-E 数据库确定它是一种活性化合物。其结构如图7C所示。

6.结论

ALISE是一种先进的虚拟药物筛选工具,集成到多功能网络平台中。ALISE的主要目标是完善和浓缩针对特定受体的潜在候选药物的初步清单。这是通过由三个不同阶段组成的顺序过程实现的,其中配体根据其结合自由能估计值进行排名。结合自由能估计值是使用三种不同的计算技术计算的:对接、MD 模拟和 FEP 模拟。
在每个阶段,只有表现出最有利的结合自由能值的配体才能进入下一阶段。配体的这种逐步分离通过避免将计算要求高的方法应用于没有希望的候选药物,确保了计算资源的最佳利用。每个阶段后获得的结果,包括具有约束力的自由能估计值和结果的图形表示,都可以在VIKING在线平台的专用结果页面上访问,如图3所示。
为了证明ALISE的性能,进行了一个专注于HIV蛋白酶的基准示例。基准测试涉及一个活性配体少于 4% 的数据集,ALISE 在最后阶段成功地将搜索范围缩小到 40% 的活性配体,其中有 15 个配体。此外,在早期调查中,排名最高的三种药物中有两种被成功测试以抑制艾滋病毒。
总体而言,ALISE的自动化和系统化虚拟药物筛选方法结合了10个单独的程序,并分三个阶段将其应用自动化。自动化方法、网络资源实施和性能表明,ALISE在药物发现和优化的早期阶段具有作为高效工具的潜力。ALISE是一个用户友好的工具,它允许计算科学家使用虚拟筛选工作流程。同时,ALISE加快了该领域专家的工作流程。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值