关系抽取介绍

这一章,我们要介绍关系抽取的背景,即知道什么是知识图谱--关系抽取,以及相关的基本概述。

一、知识图谱

介绍关系抽取前,我们需要了解一下什么是知识图谱,知识图谱最早由谷歌提出,初衷是为了让机器具备推理的能力,让它去“理解”语义层面,提供更好的查询

我们最早的搜索,是输入一个查询词,或者一个词的集合,在数据集中进行匹配,分词,将文档集进行排序,然后返回给用户,当时我们觉得他很有用,但是比如说有这么一个问题,我们想要搜索:

这个问题已经不是以前的关键词匹配所能满足的了,你无法在一篇现有的文章数据中找到这个问题的答案,所以在这个大数据的时代里,我们想要机器去思考语义、推理问题,

再比方说图灵的全名

图灵教育背景

这些都不是返回某篇文档,或者某段话,而是直接将答案返回给我们,就好像你在问一个人,你问他图灵的全名是什么,而不是问一个不会思考的机器,所以我们使用知识图谱希望机器可以思考,可以理解句子

这样,当机器再次被检索到图灵的时候,除了相关网页,还会返回一个“知识卡片”,包含了查询对象的基本信息和其相关的其他对象(艾伦 图灵也简称图灵,在搜索的时候搜索图灵即可获取艾伦图灵的相关内容)。如果我们只是想知道图灵的国籍、年龄、婚姻状况、子女信息,那么我们不用再做多余的操作。在最短的时间内,我们获取了最为简洁,最为准确的信息。这和我们人类看到熟悉的事物,会进行联想和推理一个道理

基于这个知识卡片,我们获得了关于图灵的一系列的知识,我们可以说他像人类一样展开思考,他好像能够理解艾伦图灵与图灵的关系,它能够理解图灵与计算机科学家的联系

所以基于上述因素,我们就得到了知识图谱

A knowledge graph consists of a set of interconnected typed entities and their attributes.

即知识图谱由一些相互连接的实体和他们的属性构成的,里面有更多的知识,知识之间存在联系,存在着思考和联想推理,这种思考其实就是我们经常提到的人工智能,而知识图谱就被誉为人工智能大脑的知识库。

知识图谱综合了众多方面,其中从Web角度看KG,它像建立文本之间的超链接一样,建立数据之间的语义链接,并支持语义搜索。 从NLP角度看,它主要在做怎么能够从文本中抽取语义和结构化的数据。从知识表示角度看是怎么利用计算机符号来表示和处理知识。 从AI角度则是怎么利用知识库来辅助理解人类的语言。 从数据库角度看就是用图的方式存储知识。因此要做好KG要综合利用好KR、NLP、Web、ML、DB等多方面的方法和技术。

二、关系抽取

所以我们自然而然的发现,如果我们想建立这样的一个图谱,我们需要这些圆圈,需要知道这些线上的关联词,知道各种知识的关系,知道他们是不是相关联的,就需要发现“知识”以及知识间的关系,也就是我们称作实体和实体的关系,即知识图谱中的实体抽取和关系抽取。

所以我们可以得到说,关系抽取就是识别出实体和他们之间关系,最终构造出知识图谱来。

最终,我们得到关于关系抽取的定义:

三、关系抽取背景

 

四、应用 

知识图谱在学术界和工业界受到越来越多的关注,现已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发、权限管理,人力资源管理等领域。

针对人工智能领域,知识图谱第一个就是用来搜索,这也是Google提出知识图谱的初衷;第二个就是聊天机器人,第三个就是用来做问答;还有很多私人的助理,比如说苹果手机里的Siri,还有微软的小娜,百度的度秘;同时还有很多的穿戴设备里面也用到了知识图谱相关的技术,比如iWatch;最后一个就是出行的手,国内做的非常好的“出门问问”,它也是用了相关的技术。

接下来我们对各行业中应用做一些简单的描述。

金融行业智能顾投这个听起来非常漂亮,但是目前为止,还很少有成熟的产品出来。国外的kensho做了一些探索,经过我们的分析和学习,应该还远远未达到智能投顾的级别。

生物医学领域还可以做辅助诊疗,即前面提到的IBM Watson, 即根据症状智能开方;同时也可以做相似病例的发现,目前医生在诊断的时候很大程度也是根据历史病例进行参考,因此我们可以利用知识图谱实现相似病例发现。

 

  • 3
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
关系抽取是自然语言处理中的一项重要任务,目的是从文本中识别并提取出不同实体之间的关系。nlp中常用的关系抽取方法主要包括以下几种: 1. 基于规则的方法:基于固定的规则或模式,通过匹配文本中的关键词来抽取实体之间的关系。例如,通过定义"实体A与实体B之间的关系是什么"的规则,从文本中直接提取相应的关系。 2. 基于统计的方法:通过机器学习的方法,从大量已标注的训练数据中学习如何提取关系。常用的统计模型包括支持向量机(SVM)、条件随机场(CRF)等。该方法需要大量的标注数据作为训练集,以便模型能够学习到实体之间的关系模式。 3. 基于深度学习的方法:近年来,深度学习在nlp领域取得了显著的进展,也被广泛应用于关系抽取任务。利用神经网络模型,如卷积神经网络(CNN)、循环神经网络(RNN)、Transformer等,可以对输入文本进行有效的特征提取和建模,从而实现关系的抽取。 4. 结合知识图谱的方法:知识图谱是一种用于存储和查询结构化知识的技术,它通过提供实体之间的关系描述,可以帮助关系抽取任务。结合知识图谱的方法将文本信息与图谱中的实体和关系进行匹配,从而提取出文本中实体之间的关系。 关系抽取方法的选择取决于具体任务的要求和可用资源。不同方法之间存在一定的优劣势,需要根据实际情况选择合适的方法进行关系抽取

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值