论文阅读笔记

Inferring Disease-Associated MicroRNAs Using Semi-supervised Multi-Label Graph Convolutional Networks 论文阅读笔记

背景

PCGs(蛋白质编码基因)和疾病之间的相互关联关系已经有了相当多的研究,同时也有文献证明表示miRNA和PCGs相互作用而使细胞表达出功能。在以前研究的基础上,该文章结合PCGs和miRNA之间的关系、PCGs和疾病之间的关系、PCGs和PCGs之间的关联关系来预测miRNA和疾病之间的关联。使用的方法为图卷积神经网络(GCN)。

数据处理

  1. 组织表达数据:从GTEx表达数据库钟下载了19732PCGs和2833个miRNA分别在53个组织上面的表达数据,并且在额外增加了一个在53个组织上面的表达数据之和的数据。处理完后,得到了miRNA和PCGs在组织上面的特征,特征长度为:54。

  2. 疾病—PCG关联数据:从DISEASES数据库上下载了疾病和PCG的相互关联数据,在该项研究中,只用置信分数大于等于2的数据,最后在4161钟疾病和9636个PCG之间获得了86430个关联。将其映射到Ensembl基因标识中,用该关联数据做为最后的标签(训练集标签)

  3. 疾病-miRNA关联数据,从HMDDv3.0数据哭上提取了1102个miRNA和850种疾病的32281个关联,在去除空数据并江miRNA名称映射到Rnsembl基因标识符中后(用于在两种疾病关联数据之中建立连接),获得了548个miRNA与486种疾病之间的6829个关联。(测试集标签)

  4. PCG-PCG关联数据/miRNA-PCG关联数据:利用这两种数据,在满足一定的生物学条件的基础上,构建网络,该网络由PCG和miRNA充当节点并相互关联。

方法

对于一个图卷积神经网络来说,它需要的数据有:样本的特征、样本的标签、样本之间的邻域关系。分别在数据处理中的1、2/3、4中已经获得。

方法图及详解

总结

文章的创新点其一在于整合了多种不同的网络,其二在于考虑到生物学的一些问题的优秀的预处理过程。

文章链接

https://www.sciencedirect.com/science/article/pii/S2589004219303517

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值