NLP-文本处理：实体对齐（实体统一）（Entity Resolution）【判断2个实体是否指向同一个实体：文本中的实体统一、基于图的实体统一】

最新推荐文章于 2022-11-08 16:50:09 发布

u013250861

最新推荐文章于 2022-11-08 16:50:09 发布

阅读量4k

点赞数 1

分类专栏： # NLP基础/句法语义分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/115455349

版权

NLP基础/句法语义分析专栏收录该内容

25 篇文章 12 订阅

订阅专栏

数据在收集、存储和使用的过程中，会因为系统或者人为原因，导致出现各种各样的不一致问题，这其中包括缩写、拼写错误、缺失等。这些问题的存在导致了数据中存在冗余和不一致。冗余、不一致的数据不仅造成了存储空间的浪费，更多地对后续的数据挖掘和数据分析造成了极大的阻碍。

在大多数的现实场景中，实体对齐（Entity Alignment）是用于找出单个数据集内或多个数据集间的所有指向同一个实体的记录的方法，这些记录我们称之为重复记录（duplicates）。实体对齐可以有效地将数据集中存在的冗余、不一致记录连接起来，从而为用户提供统一的数据视图。下图展示了实体对齐的通用框架结构图：

在这里插入图片描述

一、文本中的实体统一

给定2个实体，判断是否指向同一个实体的方法

1、相似度计算

Edit Distance、余弦相似度
在这里插入图片描述

2、基于规则

提前构建好实体的描述规则
在这里插入图片描述

3、有监督学习

在这里插入图片描述

二、基于图的实体统一

在这里插入图片描述

参考资料：
基于孪生循环神经网络的实体对齐算法研究

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
NLP-文本处理：实体对齐（实体统一）（Entity Resolution）【判断2个实体是否指向同一个实体：文本中的实体统一、基于图的实体统一】

自然语言处理(NLP)-文本处理：实体统一（Entity Resolution）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。