circRNA疾病关联预测--GCNCDA: A new method for predicting circRNA-disease associations based on Graph Convo

GCNCDA:一种基于图卷积网络算法预测circRNA疾病关联的新方法

PLoS Comput Biol.2020 May 20

GCNCDA: A new method for predicting circRNA-disease associations based on Graph Convolutional Network Algorithm

目录

Abstract

Materials and methods

Method overview

基准数据集

疾病相似模型的构建

多源数据融合

基于图卷积网络的快速学习特征提取

森林PA分类器预测


Abstract

大量证据表明,环状RNA(circRNAs)广泛参与疾病的发生和发展。识别circRNAs与疾病之间的关联对于探索复杂疾病的发病机制和改进疾病的诊断和治疗具有至关重要的作用。然而,由于circRNA与疾病之间的复杂机制,通过生物实验发现新的circRNA疾病关联既昂贵又耗时。因此,越来越迫切需要利用计算方法来预测新的circRNA疾病关联。在这项研究中,我们提出了一种称为GCNCDA的计算方法,该方法基于深度学习快速学习与图卷积网络(FastGCN)算法来预测潜在的疾病相关的circRNAs。具体而言,该方法首先通过融合疾病语义相似性信息、疾病和基于已知circRNA疾病关联的circRNA高斯相互作用谱(GIP)核相似性信息来形成统一描述符。然后使用FastGCN算法客观地提取融合描述符中包含的高级特征。最后,Forest by Penalizing Attributes(Forest PA)分类器准确预测了新的circRNA疾病关联。GCNCDA的5倍交叉验证实验在circR2Disease基准数据集上达到91.2%的准确率和92.78%的灵敏度,AUC为90.90%。与不同的分类器模型、特征提取模型和其他最先进的方法相比,GCNCDA显示出强大的竞争力。此外,我们对包括乳腺癌、胶质瘤和结直肠癌在内的疾病进行了病例研究实验。结果显示,预测得分最高的前20个候选circRNAs中,有16个、15个和17个分别被相关文献和数据库证实。这些结果表明,GCNCDA可以有效预测潜在的circRNA疾病关联,并为生物学实验提供高度可信的候选。

Materials and methods

Method overview

在这项研究中,我们提出了一种称为GCNCDA的计算方法来预测潜在的circRNA疾病关联。GCNCDA的执行过程分为以下步骤,其框架如图6所示。具体而言,

我们首先根据疾病语义相似性网络和circRNA疾病邻接矩阵构建疾病语义相似矩阵和疾病高斯相互作用谱(GIP)相似矩阵。然后,根据circRNA相似性网络和circRNA疾病邻接矩阵,构建circRNA-GIP相似性矩阵。接下来,通过融合策略融合疾病相似性矩阵和circRNA相似性矩阵,以获得统一的数字描述符。在第四步中,我们使用深度学习的FastGCN算法来有效地提取融合数据

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值