知识图谱的概念、应用与构建

最新推荐文章于 2024-02-28 01:15:42 发布

然后就去远行吧

最新推荐文章于 2024-02-28 01:15:42 发布

阅读量847

点赞数

分类专栏：人工智能辅助信息抽取

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37388085/article/details/106926046

版权

人工智能辅助信息抽取专栏收录该内容

1 篇文章 0 订阅

订阅专栏

目录

1、什么是知识图谱？
2、什么是信息提取？
3、自然语言理解
- 3.1 信息抽取的主要任务

1、什么是知识图谱？

互联网时代，搜索引擎是人们在线获取信息和知识的重要工具。当用户输入一个查询词，搜索引擎就会返回它认为与这个关键词最相关的网页。

直到2012年5月，搜索引擎巨头谷歌在搜索页面中首次引入了“知识图谱”的概念：用户除了得到搜索网页链接，还将看到与查询词有关的更加智能化的答案。

如下图，当用户输入居里夫人这个查询词时，谷歌会在页面右侧提供居里夫人的详细信息，如个人简介、出生时间等等。
在这里插入图片描述
知识图谱里通常用“实体(Entitiy)”来表达图的节点，用“关系(Relation)”来表达图里的边。

上图是一个汽车的知识图谱的例子，汽车可以基于品牌，结构，能源和级别进行划分，品牌等又可以进行细分。

从杂乱的网页到结构化的实体知识，搜索引擎利用知识图谱为用户提供更具条理的信息，甚至顺着知识图谱可以探索更深入、广泛和完整的知识体系，让用户发现意想不到的知识。

传统搜索引擎，以百度为例，在过去，当我们想知道“泰山”的相关信息时，我们会在百度上搜索“泰山”，它会尝试将这个字符串与百度抓取的大规模网页做对比，根据网页与这个查询词的相关程度，以及网页本身的重要性，对网页进行排序，作为搜索结果返回给用户。而用户所需的与“泰山”相关的信息，就还要自己动手，访问这些网页寻找。

传统搜索引擎的工作方式表明，它只是机械地对比查询词和网页之间的匹配关系，并没有真正地理解用户要查询的到底是什么，远远不够聪明。

知识图谱会将“泰山”理解为一个“实体”，也就是现实世界中的事物。这样搜索引擎会在页面搜索结果的右侧显示其基本资料，例如地理位置、海拔高度等。此外，还会告诉我们一些相关的“实体”，如嵩山等。

2、什么是信息提取？

对于结构化与半结构化数据需要复杂表数据的处理与定义抽取的包装器等方式将数据映射成知识图谱数据。

对于非结构化的纯文本数据需要借助自然语言处理等技术来自动提取出结构化信息。这个过程一般称为信息抽取。

在这里插入图片描述

3、自然语言理解

自然语言理解本质是结构预测，自然语言理解的众多人物，包括并不限于中文分词、词性标注、命名实体识别、共指消解、句法分析、词义角色标注等，都是在对文本序列背后特定语义结构进行预测。

3.1 信息抽取的主要任务

命名实体识别；
关系抽取；
实体统一；
指代消解；

在这里插入图片描述

然后就去远行吧

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
知识图谱的概念、应用与构建

目录1、什么是知识图谱？2、什么是信息提取？3、自然语言理解3.1 信息抽取的主要任务1、什么是知识图谱？知识图谱里通常用“实体(Entitiy)”来表达图的节点，用“关系(Relation)”来表达图里的边。上图是一个汽车的知识图谱的例子，汽车可以基于品牌，结构，能源和级别进行划分，品牌等又可以进行细分。知识图谱由谷歌提出，用于优化搜索引擎。分别在谷歌和Bing中搜索“迪丽热巴有多高”，谷歌会直接显示迪丽热巴的身高；Bing基于关键字匹配的方式将搜索词中出现的关键字与文本内容进行匹配，需要通过阅
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。