实体对齐算法_[2017]Bootstrapping Entity Alignment with Knowledge Graph Embedding

最新推荐文章于 2022-01-26 15:28:10 发布

Well Honey

最新推荐文章于 2022-01-26 15:28:10 发布

阅读量407

点赞数

文章标签：实体对齐算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42314680/article/details/112805546

版权

本文介绍了一种解决实体对齐挑战的bootstrapping方法，通过迭代训练扩大训练数据，提升KG嵌入的对齐效果。模型包括BootEA和AlignE，强调对齐导向的KG嵌入，提出新的损失函数和截断均匀负采样策略，以及一种优化的实体对齐标签编辑技巧，以克服错误积累问题。

摘要由CSDN通过智能技术生成

模型：BootEA, AlignE

AlignE和BootEA几乎一样，但是AlignE没有用bootstrapping

Introduction

存在的挑战：1.尽管一个KG的嵌入模式在过去的几年进行了广泛的探索，但是对齐方向的仍然有很多没有探索到。2.基于嵌入的实体对齐通常依赖于现存对齐的实体作为训练数据。但是，可获得先对齐好的通常只占一小部分。

为了解决上面的挑战，我们提出一个bootstrapping的方式来解决。bootstrapping在半监督学习领域广泛的使用。它通过从labeled 和 unlabeled的数据迭代地训练。受这个idea的启发。

我们的贡献有以下几点：

我们把实体对齐当作一个分类任务。基于KG嵌入在所有标记的和未标记的数据中寻找最大对齐可能的

对于对齐导向的KG嵌入，我们提出了一个基于限制的公式。对于正三元组应该得到更低的分数，对于负样本得到更高的分数。为了对难以区分的负三元组进行采样，我们提出了一种截断的均匀负采样方法。我们还将在不同KG的三元组之间交换对齐的实体，以在统一空间中校准嵌入。

为了克服缺乏训练数据，我们提出了一种bootstrapping方式，更新对齐导向的embedding通过标记可能已经对齐的并且把他们迭代地加入到训练数据中。它采用全局最优化来保证精确度，并且采用对齐的方式来减少错误累积

公式

我们定义x和y可能对齐的可能性：

我们要去选择一个

来得到最高对齐可能

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。