知识图谱(knowledge graph,KG)代表实体的相互链接描述的集合——现实世界的对象,事件,情况或抽象概念,其中:
- 描述具有正式的结构,允许人员和计算机以高效且明确的方式对其进行处理;
- 实体描述相互作用,形成一个网络,其中每个实体代表与之相关的实体描述的一部分。
关键特征
知识图谱结合了几种数据管理范例的特征,可以理解为:
- 数据库,因为可以通过结构化查询来查询数据;
- 图,因为它可以像其他任何网络数据结构一样进行分析;
- 知识库,因为其中的数据具有形式语义,可用于解释数据和推断新事实。
当使用形式语义来表达和解释知识图谱的数据时,有许多表示和建模工具:
- 类。大多数情况下,实体描述包含相对于类层次结构的实体分类。例如,当处理一般新闻或商业信息时,可能会有“人员”、“组织”和“位置”等类。个人和组织可以具有共同的超类代理。位置通常有许多子类,例如国家、人口稠密的地方、城市等。类的概念是由面向对象的设计所借用的,其中每个实体应完全属于一个类。
- 关系类型。实体之间的关系通常用类型标记,这些类型提供有关关系性质的信息,例如朋友、