NLP-信息抽取：概述【Information Extraction, 从纯文本中进行：①实体抽取与链指(命名实体识别)、②关系抽取、③事件抽取】

u013250861

已于 2022-02-19 16:55:44 修改

阅读量5.9k

点赞数 2

分类专栏： # NLP/IE-命名实体识别（NER） # NLP/IE-关系分类文章标签：人工智能自然语言处理 NLP 信息抽取

于 2021-02-01 23:59:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/113532579

版权

NLP/IE-命名实体识别（NER）同时被 2 个专栏收录

29 篇文章

订阅专栏

NLP/IE-关系分类

10 篇文章

订阅专栏

本文介绍知识抽取中的核心任务：实体抽取、关系抽取与事件抽取。实体抽取关注命名实体识别及其分类；关系抽取则针对实体间的关系进行挖掘，常用三元组表示；事件抽取涉及多元关系的抽取。这些技术为构建知识图谱提供了基础。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

知识抽取涉及的“知识”通常是清楚的、事实性的信息，这些信息来自不同的来源和结构，而对不同数据源进行的知识抽取的方法各有不同，

从结构化数据中获取知识用 D2R，其难点在于复杂表数据的处理，包括嵌套表、多列、外键关联等，
从链接数据中获取知识用图映射，难点在于数据对齐，
从半结构化数据中获取知识用包装器，难点在于 wrapper 的自动生成、更新和维护，

这一篇主要讲从文本中获取知识，也就是我们广义上说的信息抽取。

在这里插入图片描述

一、信息抽取三个最重要/最受关注的子任务

在这里插入图片描述

1、实体抽取

也就是命名实体识别，包括实体的检测（find）和分类（classify）

实体抽取后，会进行实体统一、指代消解，然后再进行关系抽取

2、关系抽取

通常我们说的三元组(triple)抽取，主要用于抽取实体间的关系：一个谓词（predicate）带 2 个形参（argument），如 Founding-location(IBM,New York)。
在这里插入图片描述

关系抽取通常在实体抽取与实体链指之后。在识别出句子中的关键实体后，还需要抽取两个实体或多个实体之间的语义关系。

语义关系通常用于连接两个实体，并与实体一起表达文本的主要含义。

常见的关系抽取结果可以用SPO结构的三元组来表示，即 (Subject, Predication, Object)

例子:中国的首都是北京 ==> (中国, 首都, 北京)

3、事件抽取

相当于一种多元关系的抽取

参考资料：
知识抽取-实体及关系抽取(一)
文献阅读15-OntoILPER:A logic-based relational learning approach关系抽取，NER+RE
关系抽取-END-TO-END NER RE-论文笔记：END-TO-END NAMED ENTITY RECOGNITION AND RELATION EXTRACTION USING PRE-TRAINED LANGUAGE MODELS
在线信息抽取网站：diffbot

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。