知识图谱de构建与应用(三):知识融合

本文详细介绍了知识融合的概念、难点及其流程,重点探讨了本体对齐、实体对齐和信息融合的方法。在本体对齐中,分析了基于语言学特征和结构特征的策略,包括同义词挖掘、模板匹配和结构信息利用。在实体对齐部分,提出了商品知识图谱中特有的问题和解决方案。最后,讨论了信息融合如何处理多个数据源的冲突,确保知识图谱的准确性和完整性。
摘要由CSDN通过智能技术生成

本章首先介绍知识融合的定义、难点和流程,接着概括性地介绍本体对齐和实体对齐的常用方法,最后介绍知识融合在工业领域实践过程中的方法和评估体系。

3.1 知识融合概述

3.1.1 知识融合的主要难点

对于很多需要构建知识图谱的领域,由于从业者甚多,自然而然地会沉淀出数量众多的数据库或知识库,比如在影视子领域,百度百科、维基百科、豆瓣等都是很好的知识库,因而在构建知识图谱的过程中往往会对多个知识库的知识进行合并,以期获得最全面的知识,这个过程就称为知识融合。此外,由于被合并的各个知识库里的知识难免会存在错误,因而知识融合会对多个知识库的知识进行交叉验证,知识融合之后获得的知识相比融合前的单知识库会更准确。

由于自然语言的开放性,各个领域的知识融合任务往往面临以下四个难点。

(1)异构问题。不同知识库对同一个实体或知识的表达差异很大,具体体现在一个相同的实体存在大量的别名。如图3-1(a)所示,不同数据源对同一个实体“华为P30”有不同的描述。

(2)歧义问题。不同的实体使用同样或类似的文本表达。如图3-1(b)所示,在电商领域中,“苹果”既可以作为一个品类名称,也可以是一个品牌名称&#x

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值