Network embedding in biomedical data science

目前大多数基于网络的方法都存在时空复杂度高的问题,在生物医学网络中,如何操作高维的稀疏向量仍然存在挑战。最近的网络嵌入技术发展提供了一种有效的范式来解决网络分析问题。在将网络映射到一个低位空间同时最大限度保留结构属性。这样下游的任务(链路预测,节点分类)就可以用传统的机器学习方法来解决了。本文综合调研了应用network embedding 来提高生物领域的内容。本文先简单介绍一些广泛使用的网络嵌入模型。然后仔细讨论网络嵌入方法是怎么被执行在生物医药网络上和他们怎么在生物科学下游任务上起到加速作用。

生物医学目标的表示包括实体和关系(节点和边)。关系数据的可用性极大促进了生物医学的研究,比如网络生物,网络医药,药物基因组学,疾病诊断,临床表型。

用网络结构分析和建模生物医学数据依赖于对网络结构的一个大致的理解。

网络嵌入提供了一个有效的方法来解决网络分析问题如图所示,具体地说网络嵌入针对于将网络转换到低维空间,并最大限度地保留网络信息。用这种方法,节点和边可以被表示成紧密压缩并且信息丰富的向量。因此,典型的非网络机器学习方法(线性回归,SVM,决策森林)被认作是有效的SOTA技术,可以被应用于这些向量。

网络嵌入方法被证明是有效的并且有潜力的。目前很多人在引入网络嵌入方法来改善生物医学数据分析性能方面做了很多努力。然而目前网络嵌入方法使用的并不广泛,生物网络是稀疏的,含噪音的,不完整的异构的,并且通常使用生物文本和其他领域知识。这使得嵌入任务更加复杂。

为了结局上述问题,理解和比较现有的网络嵌入模型是非常重要的,调查他们怎么在生物数据上实现的。这可以帮助我们更好地展望以后的工作。

在这篇文章中,我们探讨了目前存在和将来可能的在生物医学信息上的 网络嵌入应用,加速了在生物医学信息数据方面的研究。不讨论一般的网络嵌入应用,我们关注生物医学数据。包括药物相关的网络和知识图谱,多组学网络,生物医学知识图谱和异构网络(从临床数据中提取)。据我们所知目前没有详细的review讨论网络嵌入在生物医学数据的影响。为了填补这项空白,我们简短的介绍了SOTA的网络嵌入模型并且回顾了他们在生物医学领域的应用进一步探讨了目前的挑战和以后的研究方向,朝着更好的利用网络嵌入来改善目前的人类健康状况。

Network Embedding Methodologies

本节介绍了网络嵌入方法并且提出了将这些方法分类成属性网络嵌入和非属性网络嵌入。

非属性网络嵌入是异构网络,所有的节点和边属于特别的类型。学习网络嵌入保留了局部或全局结构属性,由一阶近似或高阶近似来衡量,我们接下来引入非属性网络嵌入方法看他们怎么定义大概保留。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值