实体消歧本质在于一个词可能有多个意思,也就是再不同的上下文中所表多钱啊的含义不太一样。
例如:小米、苹果
每个实体都有实体库,用于存储各种意思,如下图所示:
实体消歧算法
如下图所示:
需要判断跟哪个意思接近,即实体相似度哪一个较高。
方法:
需要将句子与解释的意思转化为向量表示,核心问题:怎么提取特征并且转化为向量?
1、要提取多少个字符串?
2、将提取的字符串转化为向量。
3、进行相似度计算
实体统一
在网络世界中不同的电子设备可能会 属于同一个人,那么将不同设备联系到同一个人的过程叫实体统一。