深度图嵌入法在协同抗癌药物组合中的应用
论文题目 | Deep graph embedding for prioritizing synergistic anticancer drug combinations |
---|---|
论文出自 | Computational and Structural Biotechnology Journal ,2020 |
一、模型介绍?
图卷积编码器+矩阵双线性解码器
整合药物组合、药物-蛋白质相互作用和蛋白质-蛋白质相互作用网络构建的。
(a) 数据收集。收集了三个子网络的药物-药物协同作用(DDS)数据、药物-靶点相互作用(DTI)数据和蛋白质-蛋白质相互作用(PPI)数据。
(b) 网络建设。对于给定的细胞系,首先将药物对的协同分数二值化,来构建DDS子网络,该子网络与DTI和PPI网络一起进一步构建细胞系异构网络。
(c) 模型推理。将异构网络输入GCN编码器。然后将每个编码节点映射到嵌入空间,以表示新空间中的药物协同预测。
(d) 模型评估。准确度、AUC和Pearson相关系数指标。
(e) 嵌入空间的探索。t-SNE法用于寻找药物组合的分布。
二、详细过程?
- 数据集:
药物-药物协同(DDS)网络、药物-靶点相互作用(DTI)网络和蛋白质-蛋白质相互作用(PPI)网络。
-
数据处理:(对于给定细胞系中的链接来构建细胞系特定网络)
1、以协同评分为30为分界点对DDS样品进行二值化,并按不同细胞系分组。
2、对于每个细胞系,我们将DDS数据映射到DTI数据,以找到蛋白质靶点。
3、然后,将DTI数据映射到PPI数据,将蛋白质-蛋白质子网络添加到异构网络中。
4、在上述操作之后,最终得到特定于细胞系的异构网络。
结果:建立了39个细胞系特异性异质网络。
来源于细胞系CAOV3的细胞系特异性异质网络。蓝绿色代表药物之间相互作用,构成DDS网络。橙色代表组成PPI网络的蛋白质间相互作用。橄榄色代表药物和蛋白质之间的相互作用,构成DTI网络。对于细胞系CAOV3,细胞系特定的DDS网络首先连接到DTI网络,然后连接到PPI网络。
我们可以选择网络的任何区域进行放大,并更详细地查看该区域。例如,(a)显示所选区域中蛋白质的条目号、名称和链接。
-
GCN编码器和矩阵解码器的工作流程
GCN模型的输入是一个图,输出是每个节点的嵌入向量。GCN编码器中有4个隐藏层。在两个隐藏层之间,都有一个ReLu激活功能。ReLu的输出是下一个隐藏层的输入。对于最后一个隐藏层,我们采用了sigmoid激活函数。矩阵解码器解码嵌入向量,以预测任何给定药物组合的协同作用得分。
-
图卷积编码器:
研究目的是利用异构网络中的所有链接信息预测药物协同链接。将信息从一个空间映射到另一个空间(即嵌入空间)。
某节点具有数值节点特征向量X1、x2、x3、,xN 2Rd,其中d为特征向量的维数。
最后一个隐藏层的激活函数是sigmoid函数
-
矩阵双线性解码器:
解码:利用嵌入空间中的嵌入信息重构边缘,在新空间中表示药物协同作用。
利用嵌入向量Zu和Zv,药物u和药物v之间的协同得分通过以下双线性形式的矩阵计算:
-
三、模型比较?
将GCN模型与其他最先进的机器学习和深度学习方法进行了比较,包括支持向量机(SVM)、随机森林、弹性网络和深度神经网络(DNN)。
GCN在AUPRC和Kappa方面表现出比DeepSynergy更好的性能;
DeepSynergy显示出比GCN更高的准确性。
这两种模型在AUC方面没有太大差异。