知识图谱方法、实践和应用（二）

最新推荐文章于 2024-07-09 12:25:04 发布

杨打滚

最新推荐文章于 2024-07-09 12:25:04 发布

阅读量1.1k

点赞数

分类专栏：从零开始知识图谱文章标签：知识图谱

本文链接：https://blog.csdn.net/yangdagun/article/details/106339649

版权

本文深入探讨知识图谱的表示与建模方法，包括语义网络、RDF/OWL/RDFS、OWL特性以及知识图谱的向量表示。介绍了从离散符号到连续向量的不同表示方式，如RDF的三元组结构、OWL的属性声明和知识图谱嵌入技术，并提及知识图谱在链接预测、三元组分类和实体对齐等领域的应用。

摘要由CSDN通过智能技术生成

二、知识图谱表示与建模

知识表示的五大用途：
- 客观事物的机器表示
- 一组本体约定和概念模型
- 支持推理的表示基础
- 用于高效计算的数据结构
- 人可理解的机器语言
历史关系：
- 语义网络表示方法（Wordnet）（M.Ross Quilian &Allan M.Collins），属于词典类型的知识库，主要定义名词、动词、形容词副词之间的语义关系。
- 随着专家系统的提出和发展，知识库构建和知识表示更受到重视。传统专家系统包含（知识库和推理引擎）两个模块
- 规范语义理论模型和形式化语义定义——描述性逻辑语言。成为大多数本体语言（OWL）的理论基础。（知识表示能力和推理计算复杂性的综合考虑）
- OWL系列标准化本体语言：DBpedia Yago Freebase Schema ORG Wikidata，拥有以符号逻辑为基础的知识表示方法：易于刻画显式、离散的知识而具有内生的可解释性，但由于人类知识包含大量不易于符号化的隐形知识，所以催生了采用连续向量的方式来表示知识
两种表示方式
- 基于离散符号的知识表示：RDF\OWL\Rule language：显式知识、强逻辑约束、易于解释、推理不易扩展
- 基于连续向量的知识表示：Tensor、embedding ：隐式知识、弱逻辑约束、不易解释、对接神经网络
早期的知识表示方法：
- 一阶谓词逻辑
- 霍恩子句和霍恩逻辑
- 语义网络
  - 优点
    - 联想性、可解释性
    - 易用性、自然语言与之转换容易
    - 结构性、各种事物之间的联系直观表达
  - 缺点
    - 无形式化语法
    - 无形式化语义（含义具有多种可解释性，从而通过推理网络而获得的推理不能保证其正确性）
- 框架（frame）
  - 描述对象属性的数据结构，类似于class
  - 优点
    - 结构性强
    - 对知识的描述很全面
  - 缺点
    - 构建成本很高，对知识库的质量要求很高
    - 推理复杂度高
    - 无法表示不确定的知识
- 描述逻辑
  - 是一阶逻辑的可判定子集，可以看做是一阶逻辑对语义网络/框架进行形式化以后的产物。互联网本体语言（OWL）的理论基础
  - 一元谓词：称为类
  - 二元谓词：称为关系
2.3 互联网时代的语义网知识表示框架
- RDF和RDFS
  - 对W3C的语义网标准栈做了分组