知识图谱是什么?

前言

本文隶属于专栏《人工智能》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!

本专栏目录结构和参考文献请见人工智能


历史

1972 年在讨论了如何为课程构建模块化教学系统之后,知识图谱这个术语就被创造出来了。

20 世纪 80 年代末,University of Groningen 和 University of Twente 联合启动了一个名为知识图谱的项目,专注于设计边缘仅限于一组有限关系的语义网络,以促进图上的代数计算。

在随后的几十年里,语义网络和知识图谱之间的区别变得模糊了。

一些早期的知识图谱是针对特定主题的。

1985年,Wordnet 成立,捕捉单词和意义之间的语义关系——将这一想法应用于语言本身。

2005年,Marc Wirk 创立了 Geonames,以捕捉不同地名、地点和相关实体之间的关系。

1998 年,英国金融科学有限公司的 Andrew Edmonds 创建了一个名为 ThinkBase 的系统,在图形上下文中提供基于模糊逻辑的推理。

2007 年,DBpedia 和 Freebase 都作为通用知识的基于图谱的知识存储库成立。

DBpedia 专注于从维基百科提取的数据,而 Freebase 还包括一系列公共数据集。没有将自己描述为“知识图谱”,而是开发和描述了相关概念。

2012 年,谷歌推出了他们的知识图谱,基于 DBpedia 和 Freebase 等来源。

他们后来纳入了从索引网页中提取的 RDFa、Microdata、JSON-LD 内容,包括中央情报局世界概况、维基数据和维基百科。

使用 schema.org 词汇表中的术语进一步组织了与该知识图谱相关的实体和关系类型。

Google Knowledge Graph 成为 Google 内部基于字符串的搜索的成功补充,其在线流行使该术语更常用。

从那时起,几家大型跨国公司宣传了他们的知识图谱使用,进一步普及了这个词。

这些包括 Facebook、LinkedIn、Airbnb、微软、亚马逊、优步和 eBay。

2019 年,IEEE 将其关于 Big Knowledge 和 Data Mining and Intelligent Computing 的年度国际会议合并为 Knowledge Graph 国际会议。


WHAT

知识图谱(Knowledge graph)没有一个普遍接受的定义。

大多数定义都是通过语义网络的视角来观察主题,包含以下功能:

1. 主题领域知识之间的灵活关系:

一个知识图谱

(i)定义了模式中实体的抽象类和关系
(ii)主要描述现实世界实体及其相互关系,以图表组织
(iii)允许任意实体可能相互关联
(iv)涵盖各种主题领域。

2. 一般结构:

实体、其语义类型、属性和关系的网络。

3. 支持推理而不是本体推断:

知识图谱获取信息并将其集成到本体中,并应用推理器来获得新知识。


然而,有许多知识图谱表示与其中一些特征无关。

对于这些知识图谱,这个更简单的定义可能更有用:

将知识表示为概念及其之间关系的数字结构(事实上的)。

知识图谱可以包括一个本体,允许人类和机器理解和推理其内容。


主要特征

知识图谱结合了几种数据管理范式的特点:

  • 数据库,因为数据可以通过结构化查询进行探索;
  • 图表,因为它们可以作为任何其他网络数据结构进行分析;
  • 知识库,因为它们具有正式的语义,可用于解释数据和推断新事实。

RDF 中表示的知识图谱为数据集成、统一、链接和重用提供了最佳框架,因为它们结合了:

资源描述框架(Resource Description Framework,RDF)是一个使用 XML 语法来表示的资料模型(Datamodel),用来描述 Web 资源的特性,及资源与资源之间的关系。

  • 表达性:语义网络栈中的标准—— RDF(S) 和 OWL——允许流畅地表示各种类型的数据和内容:数据模式、分类和词汇、各种元数据、引用和主数据。 RDF* 扩展可以轻松建模来源和其他结构化元数据。
  • 性能:所有规格都经过深思熟虑,并在实践中得到了验证,以便对数十亿个事实和属性的图表进行有效管理。
  • 互操作性:数据序列化、访问(端点的 SPARQL 协议)、管理(SPARQL 图形存储)和联合有一系列规范。使用全局唯一标识符有助于数据集成和发布。
  • 标准化:所有这些都通过 W3C 社区流程标准化,以确保满足不同参与者的要求——从逻辑学家到企业数据管理专业人员和系统运营团队。

在这里插入图片描述

普通的图 vs 知识图谱 vs 带接口的知识图谱 (以鞋子为例子)


知识图谱如何帮助文本分析?

毫不奇怪,现代文本分析技术大量利用了知识图谱:

  • 大图提供了背景知识、类似人类的概念和实体意识,以便对文本进行更准确的解释;
  • 分析结果是语义标签(注释),将文本中的引用与图表中的特定概念联系起来。这些标签代表结构化的元数据,可以更好地搜索和进一步分析;
  • 从文本中提取的事实可以添加,以丰富知识图谱,这使得它对分析、可视化和报告更有价值。

知识图谱用来干什么?

许多特定的用途和应用依赖于知识图谱。

主要包括数据和信息密集型服务,如

  • 智能内容和软件包重用
  • 响应式和上下文感知的内容推荐
  • 知识图谱驱动的药物发现
  • 语义搜索
  • 投资市场情报
  • 监管文件中的信息发现
  • 高级药物安全分析
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值