知识图谱de构建与应用(三):知识融合

本章首先介绍知识融合的定义、难点和流程,接着概括性地介绍本体对齐和实体对齐的常用方法,最后介绍知识融合在工业领域实践过程中的方法和评估体系。

3.1 知识融合概述

3.1.1 知识融合的主要难点

对于很多需要构建知识图谱的领域,由于从业者甚多,自然而然地会沉淀出数量众多的数据库或知识库,比如在影视子领域,百度百科、维基百科、豆瓣等都是很好的知识库,因而在构建知识图谱的过程中往往会对多个知识库的知识进行合并,以期获得最全面的知识,这个过程就称为知识融合。此外,由于被合并的各个知识库里的知识难免会存在错误,因而知识融合会对多个知识库的知识进行交叉验证,知识融合之后获得的知识相比融合前的单知识库会更准确。

由于自然语言的开放性,各个领域的知识融合任务往往面临以下四个难点。

(1)异构问题。不同知识库对同一个实体或知识的表达差异很大,具体体现在一个相同的实体存在大量的别名。如图3-1(a)所示,不同数据源对同一个实体“华为P30”有不同的描述。

(2)歧义问题。不同的实体使用同样或类似的文本表达。如图3-1(b)所示,在电商领域中,“苹果”既可以作为一个品类名称,也可以是一个品牌名称,甚至可以作为一种颜色或是图案名称出现。在工程实践中容易造成准确率的下降。

(3)数据噪声问题。在工业界知识图谱实践中,数据噪声问题是广泛存在的,多知识库融合会放大噪声问题,容易造成准确率的下降。如图3-1(c)所示,该商品实体的属性值很多是“不详

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值