【深度学习】命名实体识别简述和资料

一、命名实体识别含义

命名实体识别(Named Entity Recognition,简称NER),又称作“专名识别”,是指识别文本中具有特定意义的实体。一般包括3大类(实体类、时间类、数字类)和7小类(人名、地名、机构名、专有名词、时间、日期、货币和百分比)。命名实体识别是关系抽取、事件抽取、知识图谱、机器翻译、问答系统等诸多NLP任务的基础。

二、测量指标:

1、召回率 = 正确识别的实体/总的识别数量×100%
2、准确率 = 正确识别的实体/总的实体×100%
3、F-测度值 = 2×召回率×准确率/(召回率+准确率)

  • 例如,有一个长度为100的文本,其中有50个实体。模型预测出75个实体,但实际只有45个是正确实体。则:
    召回率R = 45/50=90%
    准确率P = 45/75=60%

三、标注方法:

1、标签列表如下:

  • B,即Begin,表示开始
  • I,即Intermediate,表示中间
  • E,即End,表示结尾
  • S,即Single,表示单个字符
  • O,即Other,表示其他,用于标记无关字符

2、常用标注方法:

  • BIO标注模式
    (B-begin,I-inside,O-outside)
  • BIOES标注模式
    (B-begin,I-inside,O-outside,E-end,S-single)

四、方法:

1、传统基于规则和词典的方法:
采用语言学专家手工构造规则模板,选用特征包括统计信息、标点符号、关键字、指示词和方向词、位置词(如尾字)、中心词等方法,以模式和字符串相匹配为主要手段,这类系统大多依赖于知识库和词典的建立。对每一个规则都赋予权值。当遇到规则冲突的时候, 选择权值最高的规则来判别命名实体的类。
2、基于统计的方法:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值