:::info
蛋白质相互作用的层次图学习方法
作者:Ziqi Gao ——The Hong Kong University of Science and Technology
DOI:https://doi.org/10.1038/s41467-023-36736-1
:::
ABSTRACT
- 蛋白质相互作用是生物系统中功能和信号传递的基本手段
- 本文提出一种双视角的层图学习方法能够预测PPI和推断其中的分子细节
- 创建了一个分层图,PPI网络中的每个节点(蛋白质外视图)表示一个蛋白质图(蛋白质内视图),底部视图是由化学相关描述符构成,用于捕捉蛋白质结构和功能的关系。
- 模型具有较高的预测精度和鲁棒性,模型还可以通过精确识别重要的结合位点和催化位点来解释PPI的作用。
INTRODUCTION
生物功能是通过生物分子之间的相互作用和化学反应来完成的。其中,PPIS被认为是人体最重要的分子事件之一,是疾病治疗干预的重要来源。在生物新系统中,层次信息已经被广泛的利用于获取有关感兴趣的表型的深入信息。PPI是一个两层结构。顶部视图为蛋白质相互作用,底部是关键氨基酸或残基聚集形成的重要局部区域,
现有方法
使用DL学习蛋白质的表示或者通过链接预测推断潜在的PPI
- 第一种方法是使用CNN.RNN对蛋白质序列的结构信息进行提取。其中3DCNN具有不错的性能,但是计算量大,分辨率有限,容易产生量化误差。
- 第二种方法是开发链接预测方法,识别已知网路拓扑结构中缺失的相互作用.
基于common neighbor(CN)的链接预测方法将PPI的高概率分配给已知共享共同PPIpartner的蛋白质对。CN定义:可以概括为从更大的路径长度(L3)考虑邻居,捕获了控制生物网络的结构力量和进化力量,如相互作用体。
弊端:传统的的链接预测方法大部分关注已知的交互,忽略的重要的网络属性,如节度点和社区分区。
现有方法只关注蛋白质外部和内部特征的一种。本文利用两个GNN来表示蛋白质和网络结构,首先GNN网络可以高效的学习蛋白质3D结构,由于网络传播机制,GNN能够恢复网络属性
MODEL
- In bottom view, 模型通过将氨基酸残基作为节点,将物理邻接作为边来构造蛋白质图,整合了蛋白质的结构信息和残基水平的特性。
- In top view, 以蛋白质图(底部视图)作为结构,来构建蛋白质与蛋白质之间的关系。
- 底部视图向顶部视图提供蛋白质表示,学习准确的蛋白质关系,顶部视图学习到的蛋白质关系提供了进一步优化底部视图。
- 模型输出给定蛋白质相互作用的概率,计算残基重要性来预测相互作用的关键接触位点。
模型流程
- 创建蛋白质图,通过连接图来连接物理上接近的残基,节点的属性由残基级的特征定义表示蛋白质的理化性质。
- 使用BGCN来优化蛋白质图,产生蛋白质的图表示 。
- BGCN包括两个GCN块,输入三个分量,得到蛋白质定长嵌入矢量。邻接矩阵、残基特征矩阵都是GCN的输入.
- 提高模型的表达能力和加速收敛速度,使用RELU和批归一化。
- 通过自注意力图(SAG)池化和平均聚合确保得到固定长度的向量,将所得到的向量作为PPI网络的初始特征。
- 使用TGNN,学习网络社区和度属性
- 设计GIN块包含图同构网络GIN层、Relu激活函数和BN层,通过GIN块的递归邻域聚合更新PPI网络的节点特征。