实体对齐1.ISWC 2017:(JAPE)Cross-lingual Entity Alignment via Joint Attribute-Preserving Embedding

  • 关键词:Joint Embedding

  • 摘要

实体对齐是查找两个知识库(KB)中表示现实世界相同物体的实体的任务。当面对不同自然语言的知识库时,传统的跨语言实体对齐方法依靠机器翻译来消除语言障碍。这些方法经常受到语言之间翻译质量不平衡的影响。虽然最近的基于嵌入的技术在KB中对实体和关系进行编码,并且不需要机器翻译来实现跨语言实体对齐,但是还有大量的属性尚未被研究。本文提出了一种用于跨语言实体对齐的联合属性保留嵌入模型。它将两个KBs的结构共同嵌入到一个统一的向量空间中,并通过利用KB中的属性相关性进一步细化KB。我们在真实数据集上的实验结果表明,该方法在跨语言实体对齐方面的性能显著优于目前最先进的嵌入方法,并可与基于机器翻译的方法互补。

  • 介绍

本文的主要贡献:

  • 提出了一个基于嵌入的跨语言实体对齐方法,它不依赖于跨语言KB间的机器翻译。
  • 我们通过结构嵌入联合嵌入两个KB的关系三元组,通过属性嵌入利用KB的属性三元组进一步细化嵌入。就我们所知,还没有工作在保存跨语言KB的属性信息的同时,预先学习它们的嵌入。
  • 我们在来自DBpedia的真实的跨语言数据集上评估了我们的方法。实验结果显示我们的方法表现显著优于跨语言实体对齐的两个基于嵌入的SOTA方法。此外,它还可以与基于机器翻译的传统方法相补充。
  • 通过KB嵌入实现跨语言实体对齐

                           

概述

JAPE模型框架如图1.给定两个KB,记做,他们是不同自然语言下的KB,有一些预对齐的实体或属性对(称作种子对齐,用上标标记),我们的模型学习的向量表示并且期望潜在的对齐实体被紧密嵌入。

  根据TransE,我们将关系解释为从头实体到尾实体的翻译,以表征KB的结构信息。我们让种子集中的每一对享有相同的表示,作为之间的桥梁,以构建一个覆盖关系图,并通过结构嵌入(SE)在统一向量空间下共同学习所有实体的表示。直观上,两个可对齐的KB可能有多个对齐的三元组,例如英语的和其法语的对应。在此基础上,SE旨在学习两个KB之间潜在对齐的三元组的近似表示。

  然而,SE仅限制了学习的表示必须在每个关系三元组内兼容,这导致一些实体由于它们关系三元组的稀疏性而出现无序分布。为了缓解这种不连贯的分布,我们利用属性三元组来辅助嵌入实体,这是基于潜在对齐实体通常在属性值上具有高度相似性这一观察。技术上讲,由于属性值的复杂性、异构性和跨语言性,我们忽视了它们。相反我们将属性值抽象为他们的范围类型,例如从,其中Interger是值“12”的抽象范围类

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值