论文解读:《DeepIDC:基于异构信息和深度学习的注射用药物组合预测框架》

文章地址:https://pubmed.ncbi.nlm.nih.gov/36369328/
DOI:https://hub.pubmedplus.com/10.1007/s40262-022-01180-9
期刊:Clinical Pharmacokinetics
2022年影响因子/SCI分区:5.577/二区
接收时间:2022年9月27日
Github:https://github.com/yangmoo1010/DeepIDC

1.文章概述

在临床实践中,注射药物组合(injectable drug combination,IDC)通常能为患者提供良好的治疗效果。大量临床研究直接表明,不适当的 IDC 会产生不良药物事件 (adverse drug events,ADE)。注射剂的临床应用越来越多,很多注射剂缺乏相关的组合信息。经验丰富的临床药师仍然需要参与循证药物决策、监测用药安全和管理药物相互作用。同时,大量的注射对和剂量组合限制了详尽的筛选。所以,作者提出了一个称为 DeepIDC 的预测框架,它可以方便地筛选 IDC 使用深度学习的异构信息的可行性。这是第一个识别 IDC 的特定预测框架。
由于注射药物之间的相互作用可能在混合时发生直接的物理和化学反应,可能是由于它们之间的药物靶点和通路的间接相互作用导致。作者使用分子指纹图谱、药物-靶点关联和药物-通路关联将注射液转换为一串数字向量。然后,基于这些注入向量,结合双向长短期记忆和前馈神经网络构建预测模型,以对 IDC 进行准确且有指导意义的预测。
在三个现实的评估场景中,DeepIDC 都取得了理想的预测结果。此外,与其他五种机器学习方法相比,所提出的预测器更高效、更稳健。在 DeepIDC 预测的每个 IDC 类别的前 30 个潜在 IDC 中,作者发现有 9 个案例在文献中或在 Drug.com 上得到了实验验证。

2. 关键点

  1. 在临床实践中,不适当的注射药物组合 (IDC) 会产生不良药物事件。作者提出了一种高效且稳健的性能预测框架,称为 DeepIDC,它可以使用深度学习的异构信息方便地筛选 IDC。
  2. 探讨了将 IDC 与深度学习相结合的可能交叉点,并证明了深度学习可以在 IDC 研究中取得良好的效果。
  3. DeepIDC 将有助于药理学家或生物学家有效缩小候选 IDC 的搜索空间,并提供合理注射组合的建议。

3.背景

临床上,注射是迫使液体进入组织、血管和器官以进行治疗。该方法具有见效快、疗效可靠的优点。直接注入血液循环的静脉输液(Intravenous infusion,IV infusion)特别适用于危重疾病的情况。人体是由分子组成的复杂网络。涉及疾病机制的多个复杂分子网络限制了单一注射药物疗法的疗效,尤其是在复杂疾病(例如关节炎、糖尿病、心脏病、癌症和哮喘)中。与单一疗法相比,使用多种可注射药物改善复杂疾病的治疗结果具有多重优势。IDC 是用于治疗特定适应症的两种或多种注射剂的配方。随着多次注射治疗疾病的处方越来越多,IDC 的规模也越来越大,这会带来注射组合不当的问题,会产生严重的副作用甚至死亡。不良 IDC 可分为注射药物不相容性和药理相互作用。注射用药物不相容是指注射用药物在进入体内之前发生的不良物理和/或化学反应,而不是药物在人体内的相互作用。注射剂的不相容性通常涉及沉淀、混浊、离子反应、气体的释放、生物分子的变性,甚至药物不良事件(adverse drug events, ADEs)。体内药物相互作用通常涉及改变疗效、增强副作用或增加毒性的药理学或药代动力学过程。这些都给患者带来沉重的经济负担,对医疗卫生系统造成不必要的资源消耗。因此,IDC带来的安全问题引起了广泛关注(图1)。
在这里插入图片描述
在治疗患有多种疾病的患者时,了解 IDC 对于最大程度地减少意外 ADE 和最大化协同效益至关重要。不幸的是,IDC的研究存在各种困难,主要有以下几个方面。首先,很难对患者进行实际的药物注射研究。其次,与所有可能的 IDC 相关的所有湿实验和临床检查都非常有限。第三,所有的临床试验都是昂贵且耗时的。因此,开发基于计算的模型来研究IDC越来越受到关注。迄今为止,已经开发了许多计算技术来预测潜在的药物组合,但几乎所有技术都集中在口服药物上。这些方法大致可以分为三类:基于网络的方法、基于矩阵分解的方法和基于相似性的方法。其中,基于相似性的方法是一大类,它假设相似的药物可能与同一种药物发生相互作用。虽然这些模型极大地促进了对药物组合的更好理解,但他们的研究数据集主要考虑药物组合在体内的代谢和药理作用,而 IDC 体现在物理和化学反应中。此外,由于剂型不同,个别药物分子和注射用药物的性质也会不同。
因此,为了解决 IDC 问题,作者开发了一个名为 DeepIDC 的基于深度学习的框架,它使用从注入对中提取的特征作为输入来预测 IDC 的类别。考虑更多的特征对于全面学习和更好的模型性能是必要的。因此,产生了注射剂的三个特征:化学结构(分子指纹)、药物靶标关联和药物途径关联。化学结构可以表达注射剂的理化性质,而化合物则反映药理性质。基于这些特征,构建了注入的相似矩阵作为深度学习方法的输入。双向长短期记忆(BiLSTM)用于整合注入对的信息。然后,输出流入用于预测任务的前馈神经网络。最后,为了评估 DeepIDC 的性能,作者构建了独立的测试数据集和冷启动数据集来评估模型。
注射剂的临床应用越来越多,很多注射剂缺乏相关的组合信息,需要专业的药学人员参与监测,以减少ADE 的发生。这项工作旨在确定最常见和最相关的 IDC,并审查和制定预防策略。

4.数据

注射用药物组合数据来源于中西药注射剂配伍检索表。它包括244个注射剂和五类IDC,即相容性(1级)、不适合组合(2级)、不相容性(3级)、单次使用(4级)和稀释后相容性(5级)。
由于样本需要在机器学习模型中进行量化,作者从 PubChem、DrugBank 数据库、Binding Database 和 KEGG 收集了与注射相关的信息来配制注射样本。在PubChem中,可以更精确地检索注射剂中主要化合物的分子式。使用 PubChem 提供的 API,批量获取化合物的规范简化分子输入线输入系统(SMILES)。从其他 3 个数据库收集药物-靶标关联,KEGG 也提供药物-通路关联。由于并非所有的化合物信息都可以在数据库中检索到,因此取消了一些进样。此外,4类和5类的IDC数据数量不足100个,因此将它们整合到2类中。最终收集了3396个 IDC,其中1类1295个,2类853个,3类1248个和注入142个,作为基准数据集。百分之七十的基准数据集被视为训练集。为了评估不同场景下的性能,作者构建了两个主要的测试集:热启动集和冷启动集。热启动意味着 IDC 中的两次注入都已出现在基准数据集中,而冷启动意味着基准数据集中至少没有一次注入。在我们的研究中,其余 30% 的基准数据集被视为热启动集。冷启动数据包括 45 次注射的 2496 个 IDC,由于缺乏目标或通路信息而被淘汰。

5.方法

5.1 特征提取

构建基于机器学习的IDC识别模型的第一步是对注射药物进行离散编码,同时尽可能保留注射药物的原始信息,这也是构建准确、鲁棒模型的关键。由于IDC涉及体外和体内,作者假设药物分子的化学结构可以反映IDC的物理或化学反应,药物靶点和药物途径的关系可以反映IDC在体内的相互作用。因此,获得了三种类型的注射特征,即药物的化学结构、药物-靶标关联和药物-途径关联。基于这些特征,可以将每个注入转化为一个向量,用于计算注入-注入相似度。最后,每个注射药物都可以表示为一个向量,该向量由其与所有其他注射的相似度值组成,每个 IDC 可以表示为包含两个注射特征的组合向量。

5.1.1 基于化学结构的信息

在这里插入图片描述
简化分子线性输入规范(Simplified Molecular Input Line Entry System,SMILES)是表示分子和反应的行符号(图 2a)。为了便于计算机识别,SMILES 需要将化学分子转换为一组称为分子指纹或描述符的数值。存在三种主要类型的分子指纹算法,即基于子结构键的指纹、基于拓扑或路径的指纹和基于圆形指纹。基于子结构密钥的指纹的长度由子结构的数量决定。当分子主要由给定的子结构组成时,这种方法效果最好。子结构是与化学结构相关的图的子图。它们可以由 0 和 1 的位数组表示,其中每个位位置指示结构片段的存在或不存在,例如MACCS(166 位)。基于拓扑或路径的指纹是通过分析从每个原子到特定数量的键的路径上的所有分子片段并对片段进行散列来生成的,例如RDKIT。圆形指纹也是哈希指纹。他们不是通过分子寻找路径,而是记录从原子到指定半径的每个环境,例如扩展连接指纹 (extended-connectivity fingerprint,ECFP) 和功能类指纹 ( functional-class fingerprints,FCFP)。
在这里插入图片描述

5.1.2 基于目标的信息

作者从 DrugBank、BindingDB和 KEGG 下载了药物靶标关联。Uniprot ID 用于统一不同数据库中的目标名称。数据清洗后,保留了 3112 个药物靶点关联和 993 个靶点。然后,将药物-靶点关联转化为发生率矩阵。矩阵的值(1 或 0)表示药物和目标之间是否存在相应的边缘。因此,每次注射都可以表示为基于目标的二元向量.

5.1.3 基于通路的信息

除了药物途径关联之外,药物基因关联还可以从 KEGG 下载。作者获得了那些与药物相互作用的基因的通路信息。总共保留了 1618 个药物通路关联和 314 个通路。类似于基于目标的信息,每次注射都可以表示为基于通路的二元向量。

5.1.4 相似性

基于化学结构、药物靶点和药物途径网络,每次注射都可以表示为几种二进制特征向量。然而,这些向量是稀疏的,没有考虑注入之间的关系。基于相似性的方法假设相似的注入可能与相同的注入有相互作用。因此需要生成一个相似度矩阵来表征注射。通过 Jaccard Similarity 计算任意两次注射的相似性。它是一种相似性度量,适用于衡量具有二元特征的两个数据点之间的相似性。
在这里插入图片描述
作者获得了六个 142 × 142 成对注射-注射相似性矩阵,四个化学子结构相似性矩阵:SECFP4 、SFCFP4、SMACCS 和 SRDKIT ,目标相似性矩阵 Startarget 和途径相似性矩阵 Spathway 。基于注射液与注射液的相似性,每个注射液可以表示为对应的142维行向量v。注入对 (vi, vj) ​​的表示是两个注入的特征向量的串联。

5.2 模型搭建与优化

在这里插入图片描述
采用了 Dropout 和 Batch Normalization 策略来抑制潜在的过拟合。

6.结果

6.1 特征评估(五折交叉验证)

在这里插入图片描述
在这里插入图片描述

6.2 方法比较

在这里插入图片描述
在暖启动的场景中(图5a),采用ECFP和通路特征的组合模型。
在这里插入图片描述
在冷启动的情况下,新的注入缺乏有关途径和目标的信息。因此,作者只能使用基于化学结构信息的特征进行比较。事实上,以往的特征比较结果已经表明,利用单一的化学结构特征可以提供合适的比较研究。因此,作者在冷启动任务的场景中使用了基于ECFP4的模型。
在这里插入图片描述

7.案例研究

为了进一步验证 DeepIDC 的可靠性,作者对基准数据集的补充集进行了详细的案例研究。基于 ECFP4 和通路的模型在基准数据集上进行了训练,并用于预测缺失 IDC 的概率。之后,对每个类别的概率进行排序以找到排名靠前的组合,因为它们最有可能在DeepIDC中进行交互。作者主要关注DeepIDC 预测的前 30 个潜在 IDC,并采用高可靠文献或 Drug.com 中的结果进行检查。 Drug.com 是一个全面且最新的在线药物信息来源。确认的IDC如表3所示。
对于第 2 类,Drug.com 提供了四个盐酸美沙酮相互作用的案例。盐酸美沙酮可能引起剂量相关的QT间期延长,而盐酸胺碘酮是一种常见的抗心律失常药物。根据 Drug.com 上的相互作用报告,它们的联合使用可能会产生叠加效应并增加室性心律失常的风险,包括尖端扭转型室性心动过速和心源性猝死。另外,盐酸美沙酮属于阿片类药物。当与其他中枢神经系统抑制剂(如氯硝西泮)同时使用时,可能会导致深度镇静、呼吸抑制、昏迷和死亡。盐酸可乐定或酒石酸美托洛尔与盐酸美沙酮合用可能具有降低血压的相加作用。对于第 3 类,我们发现了两个经过实验验证的案例,均表示物理化学不相容性。
在这里插入图片描述

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值