B. 知识图谱 知识建模
概述
- 知识建模的过程是知识图谱构建的基 础,高质量的数据模型能避免许多不必要、重复性的知识获取工作,有效 提高知识图谱构建的效率,降低领域数据融合的成本。
- 不同领域的知识具有不同的数据特点,可分别构建不同的本体模型。
- 知识建模一般有自顶向下和自底向上两种途径:
- 1.自顶向下的方法是指在构建知识图谱时首先定义数据模式即本体,一般 通过领域专家人工编制。从最顶层的概念开始定义,然后逐步细化,形成 结构良好的分类层次结构。
- 2.自底向上的方法则相反, 首先对现有实体进行归纳组织,形成底层的概念,再逐步往上抽象形成上 层的概念。
- 知识库构建过程
- 确定任务
- 搜集相关知识
- 确定词汇表,包括谓词、函数和常量
- 对领域通用知识编码
- 对特定问题实例描述编码
- 把查询提交给推理过程并获取答案
- 知识库调试
建模方法
- 手工建模方式
- 手工建模方式过程主要可以分为以下的六个步骤:明确领域本体及任务、模型复用、列出本体涉及领域中的元素、明确分类体系、定义属性及 关系、定义约束条件。
- 半自动建模方式
- 半自动建模方式先通过自动方式获取知识图谱,然后进行大量的人工 干预过程,运用自然语言处理技术先自动建模的方法可以 分为三大类
- 基于结构化数据的知识建模方法,
- 基于半结构化数据的知 识建模方法
- 基于非结构化数据的知识建模方法
- 半自动建模方式先通过自动方式获取知识图谱,然后进行大量的人工 干预过程,运用自然语言处理技术先自动建模的方法可以 分为三大类
知识建模评价
- 质量评价的作用在于可以对知识模型的可信度进行量 化,通过舍弃置信度较低的知识来保障知识库的质量。一个合理的本体模 型宜满足以下标准:
- 明确性和客观性:用自然语言对所定义术语给出明确的、客观的 语义定义。
- 完全性:定义是完整的,完全能表达所描述领域内术语的含义。
- 一致性:正确一致地展示数据、对象和信息,由术语得出的推论与术语本身含义不会产生矛盾。
- 最大单调可扩展性:添加通用或专用的术语时,不需要修改己有 的内容,便于知识图谱扩展。
- 最小承诺:尽可能少的约束,指本体约定应该最小,对建模对象 尽可能少的约束。
- 易用性:有效地支撑业务的分析和决策需求。