第三章 知识体系构建和知识融合
知识体系构建
知识体系主要包含三个方面的核心内容:
- 对概念的分类
- 概念属性的描述
- 概念之间相互关系的定义
知识体系的基本形态:
- 词汇
- 概念
- 分类关系
- 非分类关系
- 公理
人工构建方法
由于知识体系具有很高的抽象性和概括性,因此高质量的知识体系只能通过人工构建。人工构建知识体系的过程分为以下六步:
- 确定领域及任务
- 体系复用
- 罗列要素
- 确定分类体系
- 定义属性及关系
- 定义约束
确定领域及任务
由于知识体系与具体的领域密切相关,因此在创建知识体系之前,需要确定知识图谱面向的领域( ⇒ \Rightarrow ⇒ 限定知识体系应该包含的知识范围)
回答三个问题:
- WHY:为什么要使用这个知识体系
- WHAT:能够回答哪些类型的问题
- WHO:谁会使用并维护这个知识体系
体系复用
先构建一个轻量级的知识体系,然后尽可能基于它们进行扩展
第三方资源:
- 领域词典:医学领域–CancerOntology;文化领域的艺术与建筑词典–AAT;地理学领域的地理名称词典–TGN
- 语言学资源:WordNet,FrameNet
- 开源知识图谱:DBpedia;YAGO;Freebase;OpenCyc
- 网络百科:百度百科;互动百科;Wikipedia
罗列要素
根据确定的领域,罗列期望在知识图谱中出现的要素列表,主要包括概念、属性以及关系
确定分类体系
有两种方法:
- 自顶向下的方法:从最抽象的概念开始,逐层添加更为具体的概念
- 自底向上的方法:从最具体的概念开始,逐层开始抽象
必须保证上层所表示的概念完全包含下层所表示的概念
定义属性及关系
为知识体系中的每个类别定义属性及关系
属性—用于描述概念的内在特征
关系—用于刻画不同概念之间的关系