论文阅读（中文命名实体识别）FLAT: Chinese NER Using Flat-Lattice Transformer

最新推荐文章于 2024-04-11 17:50:18 发布

hongguoya

最新推荐文章于 2024-04-11 17:50:18 发布

阅读量949

点赞数

分类专栏： NER

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hongguoya/article/details/119580541

版权

本文介绍了FLAT模型在中文NER任务中的应用，该模型利用Transformer编码平滑字词网格，通过创新的位置编码方式引入词汇信息，提高了识别效率和准确性。FLAT在处理大规模数据时展现出优秀的并行计算能力。

摘要由CSDN通过智能技术生成

系列文章目录

提示：这是第一篇，以后再添加

FLAT: Chinese NER Using Flat-Lattice Transformer

系列文章目录
前言
一、基础概念
二、本文

前言

本论文相关工作被ACL2020会议接收。近年来，将词典信息加入模型被证明对中文命名实体识别任务很有效。但是结合词典的方法通常会使输入变为一个动态的结构，模型需要在运行时动态改别结构来表征输入，导致无法有效利用GPU的并行计算，运行速度缓慢。因此提出了FLAT模型，在Transformer的基础上，采用一个特殊的位置编码表征输入结构，而不需要在运行时改变结构来表征输入。实验结果显示我们的模型在识别实体的正确率以及运行速度上均有良好的表现。

一、基础概念

命名实体识别 Named Entity Recognition (NER) ：

从句子中抽取出一些具有特定含义的实体：组织名，地名，人名等，给定正确的分类。
目前NER一般被当作是一个序列标注任务：即在一个句子中的实体信息，会被转化成一个特定的标注序列
序列标注问题的数据标注方式主要有：BIO和BIOES。
其中：
B，即Begin，表示开始
I，即Intermediate，表示中间
E，即End，表示结尾
S，即Single，表示单个字符
O，即Other，表示其他，用于标记无关字符
如：小明在北京大学的燕园看了中国男篮的一场比赛
[B-PER ，E-PER，O, B-ORG，I-ORG，I-ORG，E-ORG，O，B-LOC，E-LOC，O，O，B-ORG，I-ORG，I-ORG，E-ORG，O，O，O，O]
模型训练完成后，模型根据输入的句子来输出对应的标签序列

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。