二、知识图谱表示与建模
- 知识表示的五大用途:
- 客观事物的机器表示
- 一组本体约定和概念模型
- 支持推理的表示基础
- 用于高效计算的数据结构
- 人可理解的机器语言
- 历史关系:
- 语义网络表示方法(Wordnet)(M.Ross Quilian &Allan M.Collins),属于词典类型的知识库,主要定义名词、动词、形容词副词之间的语义关系。
- 随着专家系统的提出和发展,知识库构建和知识表示更受到重视。传统专家系统包含(知识库和推理引擎)两个模块
- 规范语义理论模型和形式化语义定义——描述性逻辑语言。成为大多数本体语言(OWL)的理论基础。(知识表示能力和推理计算复杂性的综合考虑)
- OWL系列标准化本体语言:DBpedia Yago Freebase Schema ORG Wikidata,拥有以符号逻辑为基础的知识表示方法:易于刻画显式、离散的知识而具有内生的可解释性,但由于人类知识包含大量不易于符号化的隐形知识,所以催生了采用连续向量的方式来表示知识
- 两种表示方式
- 基于离散符号的知识表示:RDF\OWL\Rule language:显式知识、强逻辑约束、易于解释、推理不易扩展
- 基于连续向量的知识表示:Tensor、embedding :隐式知识、弱逻辑约束、不易解释、对接神经网络
- 早期的知识表示方法:
- 一阶谓词逻辑
- 霍恩子句和霍恩逻辑
- 语义网络
- 优点
- 联想性、可解释性
- 易用性、自然语言与之转换容易
- 结构性、各种事物之间的联系直观表达
- 缺点
- 无形式化语法
- 无形式化语义(含义具有多种可解释性,从而通过推理网络而获得的推理不能保证其正确性)
- 优点
- 框架(frame)
- 描述对象属性的数据结构,类似于class
- 优点
- 结构性强
- 对知识的描述很全面
- 缺点
- 构建成本很高,对知识库的质量要求很高
- 推理复杂度高
- 无法表示不确定的知识
- 描述逻辑
- 是一阶逻辑的可判定子集,可以看做是一阶逻辑对语义网络/框架进行形式化以后的产物。互联网本体语言(OWL)的理论基础
- 一元谓词:称为类
- 二元谓词:称为关系
- 2.3 互联网时代的语义网知识表示框架
- RDF和RDFS
- 对W3C的语义网标准栈做了分组
- RDF和RDFS