【IE】信息抽取任务简述

1 信息抽取任务

信息抽取(Information extraction,IE)任务指从非结构化或半结构化的文本中抽取出结构化信息。根据被抽取的对象,信息抽取可以分为以下4个任务:
(1) 实体抽取(Entity)
(2) 关系抽取(Relation)
(3) 事件抽取(Event)
(4) 情感抽取(Sentiment)
IE任务的应用背景:
(1) 互联网的蓬勃发展,捕获互联网上的舆情信息成为了需求
(2) 数据挖掘兴起后,产生了和语言文字相关的数据挖掘任务

1.1 实体抽取任务

定义:从预定语义类型(如人名、地点、组织等)的文本中识别特定类型指定物的任务。
任务
(1) 指代消解任务(Anaphora resolution),关注句子中的指代关系。

  • 找出指代关系
    在这里插入图片描述
  • 补充代词
    在这里插入图片描述

(2) 共指消解(Co-references),关注一段文本中不同的命名实体,和所有的代表这些实体的词语。
在这里插入图片描述
(3) 与知识图谱相关的任务:实体链接,实体规范化。

1.2 关系抽取任务

定义:识别句子中命名实体间的特定关系。
任务:构建知识图谱

1.3 事件抽取任务

定义:事件有不同类型,从文本中抽取事件需要关注不同的触发词(trigger word)。一个事件,除了触发词,还有相应的事件论元,如在“访问”事件中,有访问者、被访问者等属性。
任务
(1) 事实性检测:判断事件的可信度
(2) 事件时间顺序推断:自动抽取、恢复事件间原有的先后发生顺序
(3) 事件因果检测:从文本中推断事件的因果关系
(4) Script Learning:从大量文本中自从抽取整体的事件框架(script)知识的任务

1.4 情感抽取任务

任务:讽刺检测、情感词典构建、立场检测、情绪检测

链接1:https://zhuanlan.zhihu.com/p/571220239
链接2:https://www.bilibili.com/video/BV1kQ4y1r7ft/?spm_id_from=333.337.search-card.all.click&vd_source=2aa81cd07cc344789f94654b8878ab57

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zz_Lambda

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值