NLP知识抽取三个核心子任务:实体识别、关系抽取、事件抽取简述

知识抽取:通过识别、理解、筛选、格式化,把文献中的各个知识点抽取出来,以一定形式存入知识库中的过程。目的是增强信息的可使用性和可重用性,这个过程同时又可以看作对现有的非结构化信息的语义标注过程。知识抽取一共有三个核心子功能,分别是实体抽取、关系抽取、事件抽取。

一,实体抽取:也就是命名实体识别,包括实体的检测(find)和分类(classify),比如识别人名、地名等;

二,关系抽取:是指自动识别实体之间具有的某种语义关系,根据参与实体的多少可以分为二元关系抽
取(两个实体)和多元关系抽取(三个及以上实体),比如某人生活在某地,这就是两个实体间的关系;

三,事件抽取:是指从描述事件信息的文本中抽取出用户感兴趣的事件并以结构化的形式呈现出来,即将非结构化文本中的事件信息展现为结构化形式。

在传统的事件定义中,事件由事件触发词、事件论元以及事件属性构成。 事件触发词标识着事件的发生。事件论元为事件主体(Subject)、客体(Object)、时间(Time)、地点(Location)等,是表达事件重要信息的载体。事件属性包括事件极性(Polarity)、时态(Tense),是衡量事件是否真实发生的重要依据。 通过极性,事件分为肯定、否定、可能事件。通过时态,事件分为过去发生的事件、现在正在发生的事件、将要发生的事件以及其他无法确定时态的事件。

比如文本:北京时间 3 月 27 日晚上 7 点 15 分,英国首相鲍里斯约翰逊确诊感染了新冠肺炎。

事件触发词为"感染";
事件论元中,主体为英国首相鲍里斯约翰逊,客体为新冠肺炎,时间为北京时间 3 月 27 日晚上 7 点 15 分,地点无;
事件属性中,事件极性为肯定,事件时态为现在。

Done!!!

  • 5
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CrystalheartLi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值