实体对齐 算法_基于嵌入表示的网络实体对齐方法进展概述

实体对齐在跨平台社交网络和跨语言知识图谱中至关重要,但传统方法受限于标签信息和人工特征。近年来,基于嵌入表示的方法,如TransE和Deepwalk,成为研究焦点。这些方法通过网络嵌入学习将实体映射到低维空间,促进了词对齐和网络实体对齐的融合。早期方法包括JE、IONE、MTransE和PALE,之后发展出迭代策略和结合属性信息的改进模型,如BootEA、JAPE、GCN-Align等。2019年后,研究进一步拓展到无监督对齐、多视角嵌入和超大规模对齐,如MOANA、MultiKE和OAG等。
摘要由CSDN通过智能技术生成

网络实体对齐是指给定两个网络,把两个网络中等价的实体合并。实体对齐在很多领域都有重要应用,比如,跨平台社交网络的用户对齐可以用于用户画像、用户兴趣挖掘,跨语言知识图谱的实体对齐可以辅助机器翻译、跨语言信息检索。

传统的方法在做实体对齐任务时主要有两种思路。

一种是基于实体的标签信息,例如社交网络的用户昵称、知识图谱的实体名称。其效果在实际应用时并不理想,例如社交网络中,用户昵称存在重名、匿名和多用户名的问题;在知识图谱中,跨语言的实体名称依赖于机器翻译的效果。

另一种思路是基于人工定义特征,例如知识图谱中两个实体的类别是否一致、社交网络中两个用户的公共邻居有多少。这种方法需要人工针对具体问题仔细设计特征,但是这些特征大多数很难迁移到其他场景。

近几年,基于嵌入表示学习的方法越来越多地受到关注,给定一个网络,嵌入表示学习可以把实体映射为低维向量空间中的一个点。其中,知识图谱领域以TransE为代表,社交网络领域以Deepwalk为代表,这两种方法都是受到词嵌入的Skip-gram模型的启发而产生的。与网络实体对齐类似,自然语言处理中也存在跨语言a词对齐问题。在嵌入表示的方法提出之前,词对齐和网络实体对齐基本上处于独立发展的状态,嵌入表示的方法提出以后,两者的发展表现出很多的相似性。

基于嵌入表示的对齐模型在最开始提出的时候基本上遵循两种思路,这两种思路都基于单一网络的嵌入表示。

第一种思路是把一些预先匹配好的实体合并,从而把两个网络合并为一个网络,进而用单一网络的嵌入表示进行嵌入。这种方法在知识图谱中以JE [1](2016年CCKS)为代表,在社交网络中以IONE [2](2016年IJCAI)为代表。

第二种思路是先用单一网络的嵌入模型分别训练两个网络,然后用一些预先匹配好的实体训练一个线性变换对齐两个向量空间。这种方法在知识图谱中以MTransE [3](2017年IJCAI)为代表,在社交网络中以PALE [4](2016年IJCAI)为代表。具体实现的时候(如MTransE)用单一网络嵌入损失函数和向量映射的损失函数求和一起训练也能达到类似的效果。

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值