Deepwalk详解

最新推荐文章于 2024-04-15 17:10:38 发布

big_matster

最新推荐文章于 2024-04-15 17:10:38 发布

阅读量788

点赞数

分类专栏：零样本概览前部分文章标签：算法人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kuxingseng123/article/details/128083547

版权

零样本概览前部分专栏收录该内容

26 篇文章 2 订阅

订阅专栏

算法思想

源于word2vec ，word2vec通过语料库中的句子序列来描述词与词之间的共现关系。进而学习到词语的向量表示，deepwalk则使用图中的节点与节点的共像现关系来学习节点的向量表示。这种借鉴的前提是点在图中的分布和词在句子中的分布都是幂律分布。

随机游走

在这里插入图片描述
通过构建 $h i e r a r c h i c a l s o f t m a x$ ，第三步对每个结点做 $y$ 次随机游走。第四步打乱网络中的节点，可以加快随机梯度下降的速，
第五步：以每个节点为根节点生成长度为 $t$ 的随机游走。
第七步：根据生成的随机游走使用Skip-gran模型利用梯度的方法对参数进行更新。
这里得到的随机游走就相当于自然语言处理的语句，包含了点在图中的分布信息。

如何把随机游走中得到的信息用点来表示学习。

在这里插入图片描述

概率的部分意思是：在一个随机游走中，当给定一个顶点 $v_i$ 时，
出现其的 $w$ 窗口范围内顶点的概率。
同时考虑左边窗口和右边窗口，不考虑顺序。

Softmax

为什么要使用Softmax？
$Pr(u_k|\phi(v_j))$
为了方便计算
基本思想：将词典中的每个词按照词频大小构建出一颗Huffman树，保证词频较大的词处于相对比较钱的层。词频较低的词相应处于Huffma树深层的叶子节点。每一词都处于这颗Huffman树上的某个叶子节点。在这里插入图片描述
计算方法：

在二叉树的每一个节点上都存放一个向量，需要通过学习得到，最后的叶子节点上没有向量，显而易见，整棵树共有 $∣ V ∣$ 个向量，
规定在第 $k$ 层的节点做分类时，节点的左子树为正类别，节点的右子树是负类别，该节点的向量用 $V (k)$ 表示。
那么正负累的分数如公式(2)(3)所示：在预测的时候，需要按照蓝色箭头方向做分类，第0层分类结果为负类，第一层分类结果为正类。第3层分类结果为正类，最后达到叶子节点 $V (5)$ ,最后把所有节点的分类的分数累乘起来。
$p_k(left) = sigmoid(\phi(v_1) \times v(k))$

适用场景

图表示学习，捕捉节点局部的结构信息
适用于无权图，同构网络
在图稀疏的时候也能取得较好的表现。
对大型的图也能够取得较好的表现，也能够并行计算。

不足和改进

无法对图中的边信息（权重和不同的关系）进行处理。
随机游走是对节点选取的概率不够完善，没有区分广度优先和深度优先搜索，node2vec模型对此进行了改进。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
1
评论
Deepwalk详解

慢慢的将图相关领域的知识全部都将其搞定都行啦，慢慢的将其搞定都行啦的回事与打算。
复制链接

扫一扫

专栏目录

big_matster CSDN认证博客专家 CSDN认证企业博客

码龄5年

257: 原创

104万+: 周排名

198万+: 总排名

29万+: 访问

: 等级

2879: 积分

123: 粉丝

233: 获赞

52: 评论

1161: 收藏

私信

关注

热门文章

分类专栏

最新评论

LSTM和双向LSTM讲解及实践
weixin_40901147: 写得是真的好，很清晰。细胞状态就纪录语境（主题）变迁的变量，隐藏状态就是纪录注意力信息的变量（语法，用词）。新的细胞状态由新输入状态和过去的细胞状态隐藏状态决定，就是要细致分辨主题的变化，这是遗忘门和输入门的合作原理。新的隐藏状态是由新的细胞状态（新主题）和新的输入状态决定，这是输出门的工作原理。这决定了此刻此句话的意思。一个圆形相当于一个LSTM块。双向LSTM就是，若干句话顺着读产生上文语境，反着读产生下文语境，分别有上文细胞状态列和下文细胞状态列，对应输入状态产生产生上文隐藏和下文隐藏状态，对应着上下文的特征。共同决定此处特征。
open-set recognition(OSR)开集识别
qq_37441443: UKCS(unknown known classed)该怎么理解,能给个具体的例子吗
LSTM和双向LSTM讲解及实践
境界面上的双曲线: 你可以去看一下CNN+LSTM的网络结构
医疗实体及关系识别挑战赛
qq_43894281: 博主，您有这个数据集麽？如果有的话，可以发我一份麽？我找了好久都没有找到
open-set recognition(OSR)开集识别
dkdkdskk: Recent Advances in Open Set Recognition

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

big_matster 您的鼓励，是给予我最大的动力！

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。