Learning Unknown from Correlations: Graph Neural Network for Inter-novel-protein Interaction Predict

1.概述

文章主要设计了一种端到端的模型(GNN-PPI),用于预测PPI(蛋白质相互作用)网络的边(作用)类型。

主要与2019年的PIPR做对比,性能提升明显。

2.贡献

1.设计了一个新的评估框架,充分尊重新蛋白之间的相互作用,并在数据集上给出一致的评估。(新蛋白质指的是训练集中没有出现的蛋白质)

2.建议将蛋白质之间的相关性纳入PPI预测问题。提出了一种基于图神经网络的关联建模方法。

3.提出的GNN-PPI模型在不同尺度的真实数据集中达到了最先进的性能,特别是在新蛋白相互作用的预测。

3.方法

3.1问题建模

符号定义

蛋白质集合                

PPI集合      

蛋白质标签集合     

 对于任意x_{ij}的标签       

多类型PPI数据集      

蛋白质作为节点,PPIs作为边构成PPI图

 模型任务

多类型PPI学习 :  从   中学习到

 对中的任意x_{ij}预测出标签(一个或者多个)

 3.2数据集划分

 

蛋白质集 被划分成:

已知 

未知

测试集被划分成:

 测试集选取策略:

 伪代码:

条件: BS << ES + NS

采用随机法,体现不出鲁棒性 

3.3模型设计

 输入:

蛋白质集,边集,标签集

 

      

模型拆分:

1.评估板块

拆分训练集,测试集。

2.编码板块

蛋白质特征编码(蛋白质独立编码PIE->蛋白质图编码PGE)。

PIE利用氨基酸序列信息编码,并作为PPI网络的输入,PGE根据PPI网NN结合邻居信息,得到进一步的表征。

将原独立的学习任务 转换成

GNN的第k层:

表示节点p在第k层特征

本文采用的是GIN

 ε是一个可学习的参数或者是固定值

3.预测板块

对于未知的PPI,结合前一过程编码的蛋白质特征,计算它们在不同PPI类型中的得分,并输出其多标签预测。

损失函数(二元交叉熵)

 

 4.实验

 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值