浅谈Graph Embedding（一）

最新推荐文章于 2024-08-21 10:50:16 发布

L先生AI课堂

最新推荐文章于 2024-08-21 10:50:16 发布

阅读量804

点赞数

分类专栏：深度学习机器学习大白话人工智能机器学习算法文章标签：自然语言处理 tensorflow 神经网络算法 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/LHWorldBlog/article/details/128869379

版权

机器学习同时被 3 个专栏收录

34 篇文章 2 订阅

订阅专栏

大白话人工智能机器学习算法

34 篇文章 13 订阅

订阅专栏

14 篇文章 4 订阅

订阅专栏

Graph Embedding算法背景引入

先回顾下图的概念：

图(graph)由节点(vertex)和点之间连线(edge)所组成；其中，点通常被成为“顶点(vertex)”,而点与点之间的连线则被成为“边”(edge)。通常记为,G=(V,E)。常见分为无向图和有向图。

示例如下：

无向图：

有向图：

在互联网场景下，数据对象之间更多呈现的是图结构。示例如下：

用户行为数据生成的和物品全局关系图：

由属性、实体、各类知识组成的知识图谱：

在Graph 图中相关概念有BFS和DFS，示例如下：

广度优先搜索算法（Breadth-First-Search， BFS），利用队列实现。类似“湖面丢进一块石头激起层层涟漪，如下：

深度优先搜索算法（Depth-First-Search，DFS），利用递归实现。类似“不撞南墙不回头” 。

接着再回顾下Embedding的概念：

数学定义Embedding: 数学上表示一个映射关系， F: X -> Y，即一个函数。

深度学习Embedding: 用一个低维度向量表示一个实体，或者一个词（Word2Vec）,或者一个物品（Item2Vec）亦或者网络关系中的节点（Graph Embedding)。

Graph Embedding: 用低维、稠密、实值的向量表示网络中的节点。

那如何生成Graph Embedding 呢?

GraphEmbedding最开始参考的就是 NLP 领域中的Word2vec 模型，

再来回忆下Word2Vec模型。比如下段落：

苹果是蔷薇科苹果亚科苹果属植物，其树为落叶乔木。

苹果营养价值很高，富含矿物质和维生素。

苹果是一种低热量的食物，每100克产生大约60千卡左右的热量。

苹果中营养成分可溶性大，容易被人体吸收。

所有的水果里，我最爱吃苹果了。

词的语义由其上下文决定。

“A word is characterized by the company itkeeps” —— J. R. Firth

如果想要识别苹果语义，Word2vec中有如下两种方式：

Word2vec Skip Gram: 根据中心词预测上下文

Word2vec: Negative Sampling

Word2vec整体架构：

Graph Embedding 介绍：

由以上回忆可知，序列（sequence）是一种一维的关系，而图（graph）是一种二维的关系，那如何类比呢？

先看下，Graph Embedding图游走示例：

以及Graph Embedding示例：

所以Word2vec -->图嵌入领域的问题可类比生成；

通常，图中的节点会受其邻居的影响。如下所示：

此外Graph Embedding 能够生成一些“不存在”的序列。如图中

B->E->F;

D->E->C。

Graph Embedding算法之Deep Walk：

将 NLP 领域的思想运用到图(网络)嵌入领域。

Deep Walk 游走方式：RandomWalk

Deep Walk 整体架构：

节点示意图

流程示意图

Deep Walk 应用扩展之EGES算法：

Deep Walk 可以生成Item 的 Embedding 向量，从而从用户行为中捕捉高阶相似性。然而这只能针对已有的Item 而无法应对新的 Item，即无法解决冷启动问题。

对于新加入的物品或者长尾物品，无法在行为图中找到。那如何解决呢？

可以引入Side Information(补充信息)，比如商品的类别、店铺、价格等。

Eg:优衣库（同店）的两件卫衣（同品类）可能会非常相似，喜欢尼康镜头的人可能也会对佳能相机感兴趣。

所以EGES的架构思想如下：

1、通过用户行为序列生成行为关系图。

2、通过”相同属性”，“相同类别”等信息建立物品之间的边，生成基于内容的知识图谱图。

其中item 和 sideinformation（例category, brand)的Embedding 是通过 Word2vec 算法一起训练得到的。

其中的item表示为：item Embedding， category Embedding，brand Embedding等 Embedding信息求均值。即：

整体架构图如下：

下节预告：

Graph Embedding算法之Node2vec和相关案例（二）

L先生AI课堂

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

L先生AI课堂 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。