异质网络表示--基于hyperedge

最新推荐文章于 2023-07-20 11:09:18 发布

hy_jz

最新推荐文章于 2023-07-20 11:09:18 发布

阅读量8.6k

点赞数 1

分类专栏： heterogene 文章标签： hyperedge HIN embedding html5

本文链接：https://blog.csdn.net/hy_jz/article/details/79007448

版权

HEBE是一种针对异质事件数据的大规模嵌入学习方法，通过将相关节点关联到超边中保留网络信息。与传统方法不同，HEBE避免了事件分解造成的信息损失，通过事件相似性和噪声成对排名优化目标函数，实现更有效的网络表示。这种方法适用于包含多种交互的复杂网络，如DBLP和Yelp数据集。

摘要由CSDN通过智能技术生成

hyper graph是一种广义上的图，它的边可以连接任意数量的定点。[维基百科](https://zh.wikipedia.org/wiki/%E8%B6%85%E5%9B%BE)。超图是一个集合组

H=<X,E> $H=<X,E>$ , X是一个有限集合，该集合的元素称为节点或顶点；E是X的非空子集的集合，成为超边（hyper edge）或连接。因此，E是

P(X)∖{ ϕ} $\mathcal{P}(X) \setminus \{\phi\}$ 的一个子集，其中

P(X) $\mathcal{P}(X)$ 是X的一个幂集。图的边有一对节点，而超边是节点的任意集合，因而可以有任意数量的节点。每个超边连接节点数目相同的超图，是k-均匀超图。如下图所示（[维基百科](https://zh.wikipedia.org/wiki/%E8%B6%85%E5%9B%BE)）：

HEBE（Large-Scale Embedding Learning in Heterogeneous Event Data）

对于只包含单种interaction的网络，一般都是在局部采集上下文(比如在文本中的，滑动窗口内的词视为上下文)，然后通过预测上下文来构建目标函数。
对于一个包含多种节点和边类型的网络，现有的方法PTE等，将所有object之间同时存在的interaction分解为几个分散的pairwise的interaction（比如论文网络，分解为论文-作者，论文-期刊/会议等），然后用传统的single-typed网络embedding方法求解。这种分解会丢失很多重要的信息，举个例子: A在期刊V上发表了论文 $P_1$ , B在期刊V上发表了论文 $P_2$ ，但是A-B之间并没有合作关系（ $A-P_1-V-P_2-B$ ）。
HEBE 主要做的就是把跟一个事件相关的节点都关联到一个hyper edge中，以此来保留网络更多的信息。
如下图所示：
例1 DBLP数据只有一种event ：

例2 Yelp数据有两种event ：

几个基本定义

1. Information Network：给定一个有T类objects的集合 $\mathcal{X} = \{X_t\}_{t=1}^T$ （其中 $X_t$ 是所有 $t^{th}$ 类的object的集合），信息网络就是 $\mathcal{G}=(\mathcal{X}, \mathcal{E})$ ， $\mathcal{E}$ 是连接两个object的边。如果 $T \geq 2$ ，那么是异质(heterogeneous)网络；如果T=1，那么是同质（homogeneous）网络。
2. 事件(event)： $Q_i$ 可以表示为<script type="math/tex" id="MathJax-Element-14"> </script>，其中 $w_i$ 是事件 $Q_i$ 的权重； $V_i=\{V_i^t\}_{t=1}^T$ ，并且 $V_i^t \subseteq X_t$ 表示的是属于t类型的object的集合。
3. 超边： $H_i$ 刻画事件Q_i$，它把与事件的所有相关objects看作一个整体。
4. Subevent：子事件就是从每个object类型中均匀地采样出一个object组成地事件。现实的场景中，一个事件中的不同object类型对应的object数目 $|V_i^t| \geq 1$ （比如：一篇论文对应多个作者，多个term，却只对应一个venue）。对于一个事件 Qi={ Vi,wi},Vi={ a1,a2,a3}∪{