论文笔记(10): Node2Vec-Scalable Feature Learning for Networks

最新推荐文章于 2024-07-10 17:03:57 发布

腾云丶

最新推荐文章于 2024-07-10 17:03:57 发布

阅读量4.1k

点赞数 4

分类专栏： Graph-Embedding Graph Embedding 文章标签： graph embedding network embedding embedding

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wen_fei/article/details/82416141

版权

Node2Vec是一种2016年的图嵌入方法，是对DeepWalk的改进，提高了训练速度并开放源码。它通过参数化的随机游走策略结合深度优先和广度优先搜索，同时考虑网络结构和内容相似性。通过调整参数p和q，可以在DFS和BFS之间取得平衡，以适应不同应用场景。实验表明，Node2Vec在大规模图的相似性度量上表现良好，但训练时间较长。

摘要由CSDN通过智能技术生成

论文笔记：Node2Vec-Scalable Feature Learning for Networks

一、简介

node2vec是2016年提出的Graph Embedding表示方式，其训练速度快，并开放了源码，而且表示效果还不错，所以挺火。本质上来说，node2vec其实是基于DeepWalk的改进，所以要想了解node2vec，就需要先了解DeepWalk。这里对DeepWalk仅做简要介绍，详细内容还需要阅读原论文DeepWalk。

二、DeepWalk

2.1 DeepWalk简介

Input and Output

输入的是一个网络，其中颜色相同的结点表示拓扑关系上更为相近的结点。输出的是每个节点的二维向量，每个节点对应的向量关系如图所示。我们可以从这个图看出，越是网络结构相近的点，其对应的二维向量在二维空间上距离与近。

这其实是一个降维的过程，但不是传统意义上的降维，而是将图结构（一个复杂的结构）降到易于表示的低维度。具体来说，就是将网络中的拓扑结构表示成一个低维向量，这个向量可以反应结点间的连接情况。

2.1 那么，如何得到向量表示呢?

DeepWalk是这么做的：

针对网络中的每一个结点进行遍历，然后做随机游走算法，游走过程中得到了一系列有序结点。将这个节点序列类比于传统文本处理中的文章中的句子，而序列中的结点则可以类比句子中的单词。
有了上面的类比，我们便可以借助文本处理中的word embedding思想，对其进行训练，得到对应的向量。

不难看出，上面的过程简单来说，可以分为两步：第一步随机游走得到节点序列，第二步SkipGram得到向量表示。注意，这里的随机游走其实是类似深度优先遍历的过程。

2.2 DeepWalk的缺点

理解了DeepWalk的原理之后，我们不难想出它的缺点。

从随机游走来说，DeepWalk是简单的深度优先搜索的过程，深度优先往往增加了复杂度，而且没有考虑广度优先带来的周围邻居结构的影响，这里可以进行改进
原文章中没有提出一个明确的优化目标函数，成为其他学者认为不严谨的地方

最低0.47元/天解锁文章

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

腾云丶 CSDN认证博客专家 CSDN认证企业博客

码龄10年

97: 原创

5万+: 周排名

93万+: 总排名

32万+: 访问

: 等级

3811: 积分

124: 粉丝

180: 获赞

80: 评论

454: 收藏

私信

关注

热门文章

分类专栏

最新评论

node2vec代码详解
AI．愚人自愈: 所以有gpu加速版本的实现吗求 1W+的节点慢的离谱了
Balsamiq Mockups注册码
苦der学习人: 这一个都不行呀
Pytorch求索(2)： Pytorch使用visdom进行可视化
Dreaming_of_you: 很齐全。补充关于update的一点信息（来自官网md）： update can be used to efficiently update the data of an existing plot. Use 'append' to append data, 'replace' to use new data, or 'remove' to remove the trace specified by name. Using update='append' will create a plot if it doesn't exist and append to the existing plot otherwise. If updating a single trace, use name to specify the name of the trace to be updated. Update data that is all NaN is ignored (can be used for masking update).
东南大学毕业论文latex模板
L'polaris: 用Texstudio打开，编译出现，seuthesix.cls文件的错误：不知道您还记得不，知道怎么解决嘛还？ line 65: Undefined control sequence. \setCJKmainfont line 65: Missing \begin{document}. \setCJKmainfont{S line 83: Undefined control sequence. \setmainfont
node2vec代码详解
spring__festival: 请问解决了吗。。我也有这个问题

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。