中文命名实体识别NER：FLAT

最新推荐文章于 2024-04-11 17:50:18 发布

辰星M

最新推荐文章于 2024-04-11 17:50:18 发布

阅读量1.1k

点赞数 1

分类专栏：自然语言处理NLP 文章标签：中文实体识别 NER Transformer FLAT

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woniu201411/article/details/118183802

版权

目录

一、模型结构

1、位置编码

2、基于相对位置编码的self-attention

3、Feed Forward Neural Network

二、损失函数

来自ACL2020复旦大学邱锡鹏老师团队的NER领域又一力作：FLAT: Chinese NER Using Flat-Lattice Transformer.

本文在Lattice LSTM(ACL 2018)的基础上作出了两方面的改进：

作者提出了一种将Lattice图结构无损转换为扁平的Flat结构的方法，并将LSTM替换为了更先进的Transformer Encoder，该方法不仅弥补了Lattice LSTM无法「并行计算」(batchsize=1)的缺陷，而且更好地建模了序列的「长期依赖关系」；
作者提出了一种针对Flat结构的「相对位置编码机制」，使得字符与词汇得到了更充分更直接的信息交互，在基于词典的中文NER模型中取得了SOTA。

一、模型结构

1、位置编码

FLAT给每一个token/span(字、词)增加了两个位置编码，分别表示该span在sentence中开始(head)和结束(tail)的位置，对于字来说，head position和tail positio

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
2
评论
中文命名实体识别NER：FLAT

来自ACL2020复旦大学邱锡鹏老师团队的NER领域又一力作：FLAT: Chinese NER Using Flat-Lattice Transformer.本文在Lattice LSTM(ACL 2018)的基础上作出了两方面的改进：作者提出了一种将Lattice图结构无损转换为扁平的Flat结构的方法，并将LSTM替换为了更先进的Transformer Encoder，该方法不仅弥补了Lattice LSTM无法「并行计算」(batchsize=1)的缺陷，而且更好地建模了序列的「长期依赖
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。