【深度学习】命名实体识别简述和资料

最新推荐文章于 2024-08-20 03:23:43 发布

马苏比拉米G

最新推荐文章于 2024-08-20 03:23:43 发布

阅读量2.2k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44388679/article/details/100714496

版权

一、命名实体识别含义

命名实体识别（Named Entity Recognition，简称NER），又称作“专名识别”，是指识别文本中具有特定意义的实体。一般包括3大类(实体类、时间类、数字类)和7小类(人名、地名、机构名、专有名词、时间、日期、货币和百分比)。命名实体识别是关系抽取、事件抽取、知识图谱、机器翻译、问答系统等诸多NLP任务的基础。

二、测量指标：

1、召回率 = 正确识别的实体/总的识别数量×100%
2、准确率 = 正确识别的实体/总的实体×100%
3、F-测度值 = 2×召回率×准确率/（召回率+准确率)

例如，有一个长度为100的文本，其中有50个实体。模型预测出75个实体，但实际只有45个是正确实体。则：
召回率R = 45/50=90%
准确率P = 45/75=60%

三、标注方法：

1、标签列表如下：

B，即Begin，表示开始
I，即Intermediate，表示中间
E，即End，表示结尾
S，即Single，表示单个字符
O，即Other，表示其他，用于标记无关字符

2、常用标注方法：

BIO标注模式
(B-begin，I-inside，O-outside)
BIOES标注模式
(B-begin，I-inside，O-outside，E-end，S-single)

四、方法：

1、传统基于规则和词典的方法：
采用语言学专家手工构造规则模板,选用特征包括统计信息、标点符号、关键字、指示词和方向词、位置词(如尾字)、中心词等方法，以模式和字符串相匹配为主要手段，这类系统大多依赖于知识库和词典的建立。对每一个规则都赋予权值。当遇到规则冲突的时候, 选择权值最高的规则来判别命名实体的类。
2、基于统计的方法：

最低0.47元/天解锁文章

马苏比拉米G

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。