DeepWalk模型的简介与优缺点

最新推荐文章于 2022-11-22 22:57:49 发布

IT界的小小小学生

最新推荐文章于 2022-11-22 22:57:49 发布

阅读量4.8k

点赞数 1

分类专栏：自然语言处理（NLP）专栏 algorithm principle/原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HHTNAN/article/details/100975727

版权

algorithm principle/原理同时被 2 个专栏收录

23 篇文章 0 订阅

订阅专栏

自然语言处理（NLP）专栏

16 篇文章 2 订阅

订阅专栏

1、DeepWalk

[DeepWalk] DeepWalk- Online Learning of Social Representations (SBU 2014)

word2vec是基于序列进行embedding；但是，实际上实体之间的关系越来越复杂化、网络化。这个时候sequence embedding------>graph embedding。

图的定义：

G=(V,E),Evv

在这里插入图片描述

两大块内容：

1、构建序列；------->随机游走，截断随机游走

2、word2vec训练；------>Skip-gram

2.模型特点：

文章开创性的提出了随机游走 + skipGram的形式对节点进行表达，后续大量工业界对emb的应用都是参照这种形式进行的。

deepWalk的核心思想就是分为两步：
（1）通过关系网络图构建随机游走序列；
（2）把生成的序列通过skip-Gram的形式记性表示，将每个节点都能够表示在同一个空间中。文章对于算法效果的评定主要是通过对于几个网站的用户进行多标签分类的任务。
实验结果显示，提升效果比较明显，同时在训练数据比较少的情况下本算法也能够有较好的表现。

优势：

数据量比较稀疏的时候依然能够有很好的表现

支持大规模在线执行预测

能够实现并行化操作

应用到的算法和公式都是基于语言模型的。

文章提出了如果能够直接得到训练序列，也不一定需要进行随机游走这个过程。

3.参考文献：

simrank:https://www.cnblogs.com/pinard/p/6362647.html
https://zhuanlan.zhihu.com/p/45167021

https://www.cnblogs.com/pinard/p/7243513.html
原论文：http://www.perozzi.net/publications/14_kdd_deepwalk.pdf
论文翻译：https://www.jianshu.com/p/5adcc3d94159
应用参考文献：https://yq.aliyun.com/articles/716011

微信号

IT界的小小小学生

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

IT界的小小小学生 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。