# Graph Learning 第一讲

最新推荐文章于 2024-05-14 09:52:25 发布

KuAI_KST

最新推荐文章于 2024-05-14 09:52:25 发布

阅读量147

点赞数

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/KuAI_KST/article/details/118575795

版权

在数据量越来越大的今天，

word2vec是通过字词的共现关系来学习字词的向量表示，Graph Embeding的思想类似于word2vec，通过图中节点与节点的共现关系来学习节点的向量表示，构成文本序列从而计算相互关联出现的词的概率，从而计算词向量表示文本。那么在图模型中的关键的问题就是如何来描述节点与节点的共现关系，于是方法是利用DeepWalk来采样这样的文本序列，通过随机游走(RandomWalk)的方式在图中进行节点采样，从而就能够输入序列计算图的向量表示。所以deepwalk算法核心的步骤就是两步：

RandomWalk
Skip-Gram

RandomWalk是一种可重复访问已访问节点的深度优先遍历算法。给定当前访问起始节点，从其邻居中随机采样节点作为下一个访问节点，重复此过程，直到访问序列长度满足预设条件。

在这里插入图片描述

算法过程就是输入一个图，输出节点表示的矩阵，简单对步骤进行解析：

初始化：从 $\mathcal{U}^{|V| \times d}$ 样本空间中采样，embedding的大小为 $d$
构建一棵二叉树Hierarchical Softmax
开始做 $\gamma$ 步的随机游走，这里的 $\gamma$ 是初始化好的超参数
打乱采样得到的节点
这个循环是开始以每个节点为根节点开始做长度为 $t$ 的随机游走，这里的 $t$ 为初始化的超参数。然后按窗口 $w$ 进行SkipGram学习文本序列

SkipGram

一般提到word2vec有两种主要的算法，Cbow和Skip-Gram，都是在统计语言模型的基础上计算一个词在文本中出现的概率用来作为这个词的表示向量，于是优化目标就是最大化 $Pr(w_n|w_0,w_1,...,w_{n-1})$ 。 $w$ 表示的就是词。

SkipGram就是用当前词来预测上下文。丢掉了词序并且不考虑与当前词的距离。优化目标是最大化同一个句子中同时出现的词的共现概率：
$max(logPr({w_{i-k},...,w_{i-1},w_i,w_{i+1},...,w_{i+k}|w_i}))$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
# Graph Learning 第一讲

在数据量越来越大的今天，word2vec是通过字词的共现关系来学习字词的向量表示，Graph Embeding的思想类似于word2vec，通过图中节点与节点的共现关系来学习节点的向量表示，构成文本序列从而计算相互关联出现的词的概率，从而计算词向量表示文本。那么在图模型中的关键的问题就是如何来描述节点与节点的共现关系，于是方法是利用DeepWalk来采样这样的文本序列，通过随机游走(RandomWalk)的方式在图中进行节点采样，从而就能够输入序列计算图的向量表示。所以deepwalk算法核心的步骤就是两
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。