图计算论文笔记--Heterogeneous Information Network Embedding for Meta Path based Proximity

最新推荐文章于 2023-03-16 12:04:30 发布

玛卡巴卡米卡巴卡

最新推荐文章于 2023-03-16 12:04:30 发布

阅读量1.5k

点赞数 1

分类专栏：图计算文章标签：图计算 embedding HIN

本文链接：https://blog.csdn.net/travalscx/article/details/84945515

版权

图计算专栏收录该内容

24 篇文章 3 订阅

订阅专栏

Heterogeneous Information Network Embedding for Meta Path based Proximity

abstract
keywords
introduction
related work
problem definition
HINE
experiment
总结

abstract

在异构信息网络上做嵌入
使用meta-path
proximity measures
objective function 最小化两个距离：
meta path based proximities
proximities in the embedded vector space
使用副样本加速优化过程
本文的方法为HINE

keywords

异构信息网络，meta-path，网络嵌入

introduction

使用HIN上的meta-path嵌入
建立的function来最小化两个相似度距离
使用副样本加速优化过程
对四组异构网络做实验

文章的方法使用了网络上的结构信息，顶点和边的类型信息

related work

异构信息网络
meta-path
embedding

problem definition

HIN 异构信息网络G = (V,E)
HIN schema TG =(L,R)
L是V的类型，R是E的类型
meta-path based proximity 两个点在meta-path模式P下的proximity
有两种计算方法：
Proximity in HIN 两个点在整个图上的Proximity
也就是所有的P模式下的两个点的meta-path based proximity之和
HIN Embedding for Meta Path based Proximity
将图上的点embedding后能够保护上述的meta-path based proximity和Proximity in HIN

HINE

HINE是本文对HIN进行embedding的方法

介绍meta-path的Truncated Proximity Calculation
介绍model和定义目标函数
使用副样本

Truncated Proximity Calculation

Truncated Proximity Calculation的意思就是在计算proximity的时候，只采用长度小于threshold L的meta-path。因此Proximity in HIN 定义为：
在这里插入图片描述
性质：
其实很好理解，也就是这个路径的proximity就是路径上每一个边的proximity的成积。
使用算法来计算一个proximity矩阵，记录每两个点之间的proximity：

model

两个点之间的joint probability：
使用sigmoid，其中vi和vj是点i和点j已经embedding到低维空间的向量
在这里插入图片描述
按照之前我们定义的proximity，两个点之间的相似度应该是：

因此，我们可以得到一个目标函数，这个目标函数通过最小化上面的两个p的距离，来保持embedding后网络的proximity，最小化距离，可以使用KL散度：在这里插入图片描述
使用KL散度得到此目标函数的过程：