知识图谱是什么？

Shockang

已于 2022-07-24 21:32:57 修改

阅读量713

点赞数 1

分类专栏：人工智能文章标签：知识图谱人工智能

于 2022-06-12 22:21:43 首次发布

本文链接：https://blog.csdn.net/Shockang/article/details/125251057

版权

人工智能专栏收录该内容

6 篇文章 4 订阅

订阅专栏

前言

本文隶属于专栏《人工智能》，该专栏为笔者原创，引用请注明来源，不足和错误之处请在评论区帮忙指出，谢谢！

本专栏目录结构和参考文献请见人工智能

历史

1972 年在讨论了如何为课程构建模块化教学系统之后，知识图谱这个术语就被创造出来了。

20 世纪 80 年代末，University of Groningen 和 University of Twente 联合启动了一个名为知识图谱的项目，专注于设计边缘仅限于一组有限关系的语义网络，以促进图上的代数计算。

在随后的几十年里，语义网络和知识图谱之间的区别变得模糊了。

一些早期的知识图谱是针对特定主题的。

1985年，Wordnet 成立，捕捉单词和意义之间的语义关系——将这一想法应用于语言本身。

2005年，Marc Wirk 创立了 Geonames，以捕捉不同地名、地点和相关实体之间的关系。

1998 年，英国金融科学有限公司的 Andrew Edmonds 创建了一个名为 ThinkBase 的系统，在图形上下文中提供基于模糊逻辑的推理。

2007 年，DBpedia 和 Freebase 都作为通用知识的基于图谱的知识存储库成立。

DBpedia 专注于从维基百科提取的数据，而 Freebase 还包括一系列公共数据集。没有将自己描述为“知识图谱”，而是开发和描述了相关概念。

2012 年，谷歌推出了他们的知识图谱，基于 DBpedia 和 Freebase 等来源。

他们后来纳入了从索引网页中提取的 RDFa、Microdata、JSON-LD 内容，包括中央情报局世界概况、维基数据和维基百科。

使用 schema.org 词汇表中的术语进一步组织了与该知识图谱相关的实体和关系类型。

Google Knowledge Graph 成为 Google 内部基于字符串的搜索的成功补充，其在线流行使该术语更常用。

从那时起，几家大型跨国公司宣传了他们的知识图谱使用，进一步普及了这个词。

这些包括 Facebook、LinkedIn、Airbnb、微软、亚马逊、优步和 eBay。

2019 年，IEEE 将其关于 Big Knowledge 和 Data Mining and Intelligent Computing 的年度国际会议合并为 Knowledge Graph 国际会议。

WHAT

知识图谱（Knowledge graph）没有一个普遍接受的定义。

大多数定义都是通过语义网络的视角来观察主题，包含以下功能：

1. 主题领域知识之间的灵活关系：

一个知识图谱

（i）定义了模式中实体的抽象类和关系
（ii）主要描述现实世界实体及其相互关系，以图表组织
（iii）允许任意实体可能相互关联
（iv）涵盖各种主题领域。

2. 一般结构：

实体、其语义类型、属性和关系的网络。

3. 支持推理而不是本体推断：

知识图谱获取信息并将其集成到本体中，并应用推理器来获得新知识。

然而，有许多知识图谱表示与其中一些特征无关。

对于这些知识图谱，这个更简单的定义可能更有用：

将知识表示为概念及其之间关系的数字结构（事实上的）。

知识图谱可以包括一个本体，允许人类和机器理解和推理其内容。

主要特征

知识图谱结合了几种数据管理范式的特点：

数据库，因为数据可以通过结构化查询进行探索；
图表，因为它们可以作为任何其他网络数据结构进行分析；
知识库，因为它们具有正式的语义，可用于解释数据和推断新事实。

RDF 中表示的知识图谱为数据集成、统一、链接和重用提供了最佳框架，因为它们结合了：

资源描述框架（Resource Description Framework，RDF）是一个使用 XML 语法来表示的资料模型（Datamodel）,用来描述 Web 资源的特性，及资源与资源之间的关系。

表达性：语义网络栈中的标准—— RDF(S) 和 OWL——允许流畅地表示各种类型的数据和内容：数据模式、分类和词汇、各种元数据、引用和主数据。 RDF* 扩展可以轻松建模来源和其他结构化元数据。
性能：所有规格都经过深思熟虑，并在实践中得到了验证，以便对数十亿个事实和属性的图表进行有效管理。
互操作性：数据序列化、访问（端点的 SPARQL 协议）、管理（SPARQL 图形存储）和联合有一系列规范。使用全局唯一标识符有助于数据集成和发布。
标准化：所有这些都通过 W3C 社区流程标准化，以确保满足不同参与者的要求——从逻辑学家到企业数据管理专业人员和系统运营团队。

在这里插入图片描述

普通的图 vs 知识图谱 vs 带接口的知识图谱（以鞋子为例子）

知识图谱如何帮助文本分析？

毫不奇怪，现代文本分析技术大量利用了知识图谱：

大图提供了背景知识、类似人类的概念和实体意识，以便对文本进行更准确的解释；
分析结果是语义标签（注释），将文本中的引用与图表中的特定概念联系起来。这些标签代表结构化的元数据，可以更好地搜索和进一步分析；
从文本中提取的事实可以添加，以丰富知识图谱，这使得它对分析、可视化和报告更有价值。

知识图谱用来干什么？

许多特定的用途和应用依赖于知识图谱。

主要包括数据和信息密集型服务，如

智能内容和软件包重用
响应式和上下文感知的内容推荐
知识图谱驱动的药物发现
语义搜索
投资市场情报
监管文件中的信息发现
高级药物安全分析

Shockang

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
知识图谱是什么？

1972 年在讨论了如何为课程构建模块化教学系统之后，知识图谱这个术语就被创造出来了。20 世纪 80 年代末，University of Groningen 和 University of Twente 联合启动了一个名为知识图谱的项目，专注于设计边缘仅限于一组有限关系的语义网络，以促进图上的代数计算。在随后的几十年里，语义网络和知识图谱之间的区别变得模糊了。一些早期的知识图谱是针对特定主题的。19...
复制链接

扫一扫