Hierarchical graph learning for protein– protein interaction

:::info
蛋白质相互作用的层次图学习方法
作者:Ziqi Gao ——The Hong Kong University of Science and Technology
DOI:https://doi.org/10.1038/s41467-023-36736-1
:::

ABSTRACT

  1. 蛋白质相互作用是生物系统中功能和信号传递的基本手段
  2. 本文提出一种双视角的层图学习方法能够预测PPI和推断其中的分子细节
    • 创建了一个分层图,PPI网络中的每个节点(蛋白质外视图)表示一个蛋白质图(蛋白质内视图),底部视图是由化学相关描述符构成,用于捕捉蛋白质结构和功能的关系。
  3. 模型具有较高的预测精度和鲁棒性,模型还可以通过精确识别重要的结合位点和催化位点来解释PPI的作用。

INTRODUCTION

生物功能是通过生物分子之间的相互作用和化学反应来完成的。其中,PPIS被认为是人体最重要的分子事件之一,是疾病治疗干预的重要来源。在生物新系统中,层次信息已经被广泛的利用于获取有关感兴趣的表型的深入信息。PPI是一个两层结构。顶部视图为蛋白质相互作用,底部是关键氨基酸或残基聚集形成的重要局部区域,
现有方法
使用DL学习蛋白质的表示或者通过链接预测推断潜在的PPI

  1. 第一种方法是使用CNN.RNN对蛋白质序列的结构信息进行提取。其中3DCNN具有不错的性能,但是计算量大,分辨率有限,容易产生量化误差。
  2. 第二种方法是开发链接预测方法,识别已知网路拓扑结构中缺失的相互作用.

基于common neighbor(CN)的链接预测方法将PPI的高概率分配给已知共享共同PPIpartner的蛋白质对。CN定义:可以概括为从更大的路径长度(L3)考虑邻居,捕获了控制生物网络的结构力量和进化力量,如相互作用体。
弊端:传统的的链接预测方法大部分关注已知的交互,忽略的重要的网络属性,如节度点和社区分区。
现有方法只关注蛋白质外部和内部特征的一种。本文利用两个GNN来表示蛋白质和网络结构,首先GNN网络可以高效的学习蛋白质3D结构,由于网络传播机制,GNN能够恢复网络属性

MODEL

image.png

  1. In bottom view, 模型通过将氨基酸残基作为节点,将物理邻接作为边来构造蛋白质图,整合了蛋白质的结构信息和残基水平的特性。
  2. In top view, 以蛋白质图(底部视图)作为结构,来构建蛋白质与蛋白质之间的关系。
  3. 底部视图向顶部视图提供蛋白质表示,学习准确的蛋白质关系,顶部视图学习到的蛋白质关系提供了进一步优化底部视图。
  4. 模型输出给定蛋白质相互作用的概率,计算残基重要性来预测相互作用的关键接触位点。

模型流程

  1. 创建蛋白质图,通过连接图来连接物理上接近的残基,节点的属性由残基级的特征定义表示蛋白质的理化性质。
  2. 使用BGCN来优化蛋白质图,产生蛋白质的图表示 。
    1. BGCN包括两个GCN块,输入三个分量,得到蛋白质定长嵌入矢量。邻接矩阵、残基特征矩阵都是GCN的输入.
    2. 提高模型的表达能力和加速收敛速度,使用RELU和批归一化。
    3. 通过自注意力图(SAG)池化和平均聚合确保得到固定长度的向量,将所得到的向量作为PPI网络的初始特征。
  3. 使用TGNN,学习网络社区和度属性
    1. 设计GIN块包含图同构网络GIN层、Relu激活函数和BN层,通过GIN块的递归邻域聚合更新PPI网络的节点特征。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值