AI医药论文笔记--MUFFIN: multi-scale feature fusion for drug–drug interaction prediction

MUFFIN:多尺度特征融合预测药物-药物相互作用

论文题目MUFFIN: multi-scale feature fusion for drug–drug interaction prediction
论文出自Bioinformatics, 2021, 1–8

一、研究现状?

以往的研究利用大量的标记数据,仅仅考虑药物的结构或序列信息,而没有考虑药物与其他生物医学对象(如基因、疾病、通路)之间的关系或拓扑信息,或仅考虑知识图(KG)而不考虑药物分子结构信息。

二、MUFFIN模型?

MUFFIN是一种基于药物化学结构生物医学KG的DDI预测深度学习框架,可以联合学习基于药物自身结构信息具有丰富生物医学信息的KG的药物表征

引入了两级架构,包括交叉级和标量级模块,可以融合不同粒度的内部和外部特性。

(i)交叉级是对不同的特征进行叉乘运算,对局部特征(基于CNN)和全局特征进行提取和聚合;

(ii)标量级通过元素积提取出许多细粒度融合特征。
在这里插入图片描述
由三个模块组成:

(a)表示学习模块(左):MUFFIN利用药物结构信息,将其输入MPNN学习基于图的结构表示m1。对于KG中的实体,MUFFIN使用KGE方法(如TransE)来获得基于KG的表示m2。

(b)特征融合模块(中间部分):设计了一种双层融合策略,包括交叉级和标量级单元。上面部分实现跨层融合策略,将两种表示作为跨乘积运算的输入,然后利用基于CNN的网络扁平化运算获得局部和全局特征。通过连接操作和全连接层接收跨层表示m3。下半部分是标量级融合策略,该策略使用元素积获得标量级表示m4。

(c)分类器模块(右侧):将四部分表示进行串联,送入全连接层,进行二类、多类、多标签的DDI预测

三、表示学习模块?

  • Graph-based representation
    在这里插入图片描述
    对于每一个药物,根据其SMILES序列,建立一个分子图。使用消息传递网络产生药物结构的特征表示。这个步骤包括两个阶段–消息传播阶段和读出阶段。

    • 消息传播阶段,执行k次迭代通过聚合节点p的邻接信息来更新节点p的表示,第一阶段的描述如下:
      [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FG76drWC-1643094541149)(E:\DBLab\MyNote\pictures\image-20220118152640872.png)]
    • 读出阶段,基于图的药物表示可以通过基于k次迭代后生成的节点表示的读出阶段获得,第二阶可以描述如下:
      在这里插入图片描述
  • KG-based representation
    在这里插入图片描述

    对于图中的每个实体和关系,使用TransE来获得知识图的特征表示。

    • 对于TransE:
      简单来说,TransE就是将知识图谱中的实体和关系看成两个Matrix。实体矩阵结构为n × d,其中n表示实体数量,d表示每个实体向量的维度,矩阵中的每一行代表了一个实体的词向量;而关系矩阵结构为 r × d,其中r代表关系数量,d表示每个关系向量的维度。TransE训练后模型的理想状态是,从实体矩阵和关系矩阵中各自抽取一个向量,进行L1或者L2运算,得到的结果近似于实体矩阵中的另一个实体的向量,从而达到通过词向量表示知识图谱中已存在的三元组( h , r , t )的关系。

四、特征融合模块?

采用了一种双层策略来融合基于图的特征表示和基于知识图的特征表示。融合特征用于表达多方面药物特征的交互信息。在双层融合操作之前,使用一个全连接层将特征向量转移到同一公共空间。然后,向量分别表示为u和v(分别对于z和e)。其中z和e分别代表基于图和基于知识图谱的特征表示。

  • Cross-level
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FlRAOzrg-1643094541162)(E:\DBLab\MyNote\pictures\image-20220118153215246.png)]
    在这里插入图片描述
    然后使用CNN模型学习局部的交互特征,并且将Ci 展平来学习全局特征。然后串联局部特征和全局特征,把它们输入一个全连接层来得到cross-level的特征。

  • Scalar-level
    在这里插入图片描述
    我们使用基于元素的乘积运算对从基于知识图谱的表示中学习到的u i和v i之间的特征交互进行编码,然后将元素向量输入到完全连接的层中,以获得标量级融合特征s i ,此过程可表示为:
    在这里插入图片描述

五、分类器模块?

在这里插入图片描述

  • 连接基于图特征表示u i,基于知识图谱的特征表示v i ,cross_level融合后的特征表示a i,以及scalar_level融合后的特征表示s i,这四个部分的特征后表示为d i 。这个过程的可以表示为如下公式:
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sHtLNgGL-1643094541192)(E:\DBLab\MyNote\pictures\image-20220118153613173.png)]
  • 对于DDI的预测任务,我们连接药物的特征表示然后把他们送入全连接层来预测DDI的概率分数如下:
    在这里插入图片描述yij代表在二分类任务中的药物对有关联的可能性,在multi-class和multi_label任务中它代表每一种相关性的可能性。

六、实验结果?

分别采用DRKG、DrugBank和TWOSIDES作为二进制类、多类和多标签任务的数据集。
在这里插入图片描述

七、思考?

设计了一个包含交叉级标量级组件的双层交叉策略,可以从基于卷积神经网络的交叉和标量层面视角共同学习药物内部(化学结构)和外部(KG)特征的融合表征。该双层结构通过多粒度特征融合过程,有效地结合了多模态特征,提高了DDI预测能力。

优点:MUFFIN可以将从大规模KG中学习到的特征与药物分子图交叉,缓解深度学习模型中标记数据有限的限制

不足:DRKG中仍然存在数据冗余,在未来的工作中,将使用实体对齐技术来提高KG的质量和可用性。

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值