Predicting Drug−Target Interaction Using a Novel Graph Neural Network with 3D Structure-Embedded

Predicting Drug−Target Interaction Using a Novel Graph Neural Network with 3D Structure Embedded Graph Representation 笔记

在这里插入图片描述

摘要

提出一种基于图神经网络的预测药物–靶向相互作用的深度学习方法,介绍了一种有距离意识的图注意力算法,用于区分不同类型的分子间相互作用。而且直接从蛋白-配体的结合位点的3D结构中抽取分子相互作用的图特征。所以这模型可以更加准确的学习到药物-靶向的关键特征,而不是仅仅只是记住了受体分子的模式。

模型特点(贡献)

这篇论文跟其他的DTI(drug target interaction)用的直接用两个模型先分别单独对蛋白质和分子进行处理,最后再结合在一起不同。
对药分子和蛋白质的单独处理,嵌入表示进行结合的时候其实用的隐含的结合姿态和位点,
而这里是将结构显式的表示了,具体就是将结合姿势的3D结构体现出来,用的方式就是用两个连接矩阵来表示共价相互作用和非共价相互作用。

method

graph neural network

  • ( V , E , A ) (V,E,A) (V,E,A),V 是顶点集,E是边集,A是连接矩阵。 A ∈ R N × N A\in \mathbb{R}^{N\times N} ARN×N
    GNNs 由3个阶段组成,(1)更新结点特征(2)聚合结点特征和处理图特征(3)预测图的标签

嵌入蛋白配体复合物的结构信息

A 1 A^1 A1表示纯共价相互作用, A 2 A^2 A2表示共价和非共价的原子相互作用。
在这里插入图片描述在这里插入图片描述 e − ( d i j − μ ) 2 / σ e^{-(d_{ij}-\mu)^2/ \sigma} e(dijμ)2/σ分子间键比共价键弱,随着键距的增加,它们的强度也越来越弱,

距离意识的图注意力机制和门增强算法

输入到GAT的是邻接阵A和结点特征
x i n = { x 1 i n , x 2 i n , . . . , x N i n } \mathbf x^{in}=\{x_1^{in},x_2^{in},...,x_N^{in}\} xin={x1in,x2in,...,xNin} x ∈ R F x\in\mathbb R^{F} xRF,GAT框架参考https://blog.csdn.net/weixin_40248634/article/details/103481789A是用来计算当前节点领域的。这里的顶点包含了结合部分的所有顶点。即下图的绿点和红点。
在这里插入图片描述
这里为了更好的提高表达能力,我们这里提出了不同于上面参考的GAT的形式。每个输入特征先进行线性变换,即 x i ′ = W x i i n , W ∈ R F × F x_i'=Wx_i^{in},W\in \mathbb{R}^{F\times F} xi=WxiinWRF×F
然后attention 系数 e i j e_{ij} eij计算为 e i j = x i ′ E x j ′ + x j ′ E x i ′ e_{ij}=x'_iEx_j'+x'_jEx_i' eij=xiExj+xjExi
这里 E ∈ R F × F E\in \mathbb{R}^{F\times F} ERF×F,W和E都是可学习的。这个加法处理可以让 e i j = e j i e_{ij}=e_{ji} eij=eji。下面乘 A i j A_ij Aij是因为 A 2 A^2 A2非共价键部分是实数值,越小则重要性越低。
在这里插入图片描述最后通过节点的线性求和得到下面式子
在这里插入图片描述这里对输出使用门增强算法,即用将 x i x_i xi x i ′ ′ x_i'' xi线性组合

在这里插入图片描述这里 z i z_i zi由下定义, U ∈ R 2 F × 1 U\in\mathbb R^{2F\times 1} UR2F×1,所以 z i ∈ R z_i\in \mathbb R ziR,U b可学习, z i z_i zi表示输入结点的特征有多少是会直接传递到下一层的。
在这里插入图片描述
在这里插入图片描述

神经网络框架

这里使用上面的门增强的注意力,共享参数,依次处理 x 1 = G A T ( x , A 1 ) x^1=GAT(x,A^1) x1=GAT(x,A1) x 2 = G A T ( x , A 2 ) x^2=GAT(x,A^2) x2=GAT(x,A2)(这里的x就是 x i n x^{in} xin),然后相减
在这里插入图片描述然后将上面的 x o u t x^{out} xout又作为下次输入的 x i n x^{in} xin, 更新几次的门增强图注意力层之后,最后得到蛋白-配体复合物的向量表示
在这里插入图片描述这里是因为 x i x_i xi有可能属于蛋白的口袋,也可能属于配置,这里将配体的原子特征表示加起来就可以了,变成一维向量。
最后将 x g r a p h x^{graph} xgraph输入到sigmoid函数,进行预测是否有相互影响。

data set preparation

DUDE 和PDBbind,72个蛋白质train 25个蛋白质test。蛋白质-配体复合物3D结构由docking 计算出来。

结果

在这里插入图片描述
在这里插入图片描述在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值