异质网络表示--基于hyperedge

hyper graph是一种广义上的图,它的边可以连接任意数量的定点。[维基百科](https://zh.wikipedia.org/wiki/%E8%B6%85%E5%9B%BE)。超图是一个集合组 H=<X,E> , X是一个有限集合,该集合的元素称为节点或顶点;E是X的非空子集的集合,成为超边(hyper edge)或连接。因此,E是 P(X){ ϕ} 的一个子集,其中 P(X) 是X的一个幂集。图的边有一对节点,而超边是节点的任意集合,因而可以有任意数量的节点。每个超边连接节点数目相同的超图,是k-均匀超图。如下图所示([维基百科](https://zh.wikipedia.org/wiki/%E8%B6%85%E5%9B%BE)):

HEBE(Large-Scale Embedding Learning in Heterogeneous Event Data)

对于只包含单种interaction的网络,一般都是在局部采集上下文(比如在文本中的,滑动窗口内的词视为上下文),然后通过预测上下文来构建目标函数。
对于一个包含多种节点和边类型的网络,现有的方法PTE等,将所有object之间同时存在的interaction分解为几个分散的pairwise的interaction(比如论文网络,分解为论文-作者,论文-期刊/会议等),然后用传统的single-typed网络embedding方法求解。这种分解会丢失很多重要的信息,举个例子: A在期刊V上发表了论文 P1 , B在期刊V上发表了论文 P2 ,但是A-B之间并没有合作关系( AP1VP2B )。
HEBE 主要做的就是把跟一个事件相关的节点都关联到一个hyper edge中,以此来保留网络更多的信息。
如下图所示:
例1 DBLP数据只有一种event :

例2 Yelp数据有两种event :

几个基本定义

1. Information Network: 给定一个有T类objects的集合 X={ Xt}Tt=1 ( 其中 Xt 是所有 tth 类的object的集合),信息网络就是 G=(X,E) E 是连接两个object的边。如果 T2 , 那么是异质(heterogeneous)网络;如果T=1,那么是同质(homogeneous)网络。
2. 事件(event) Qi 可以表示为 <Vi,wi> <script type="math/tex" id="MathJax-Element-14"> </script>,其中 wi 是事件 Qi 的权重; Vi={ Vti}Tt=1 ,并且 VtiXt 表示的是属于t类型的object的集合。
3. 超边 Hi 刻画事件Q_i$,它把与事件的所有相关objects看作一个整体。
4. Subevent:子事件就是从每个object类型中均匀地采样出一个object组成地事件。现实的场景中,一个事件中的不同object类型对应的object数目 |Vti|1 (比如:一篇论文对应多个作者,多个term,却只对应一个venue)。对于一个事件 Qi={ Vi,wi},Vi={ a1,a2,a3}{

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值