TENER: Adapting Transformer Encoder for Named Entity Recogni

最新推荐文章于 2023-03-25 22:18:17 发布

SYSU_BOND

最新推荐文章于 2023-03-25 22:18:17 发布

阅读量390

点赞数

分类专栏：实体识别论文阅读文章标签： NER 实体识别自然语言处理

本文链接：https://blog.csdn.net/SYSU_BOND/article/details/117341280

版权

12 篇文章 0 订阅

订阅专栏

5 篇文章 1 订阅

订阅专栏

这篇文章应该是第一篇使用Transformer取得比较好效果的论文，分析了Transformer的特性，同时提出两种改进：

【基于直觉】对于NER任务，可能几个上下文关键词就可以帮助判断，故而应该增强这些关键词的作用，而原始Transformer会有scale过程削弱这些词作用，故而使用un-scaled、sharp的Attention，增强稀疏性

Transformer改进：
- position emb改进：
  - 原公式中，若以Q·K计算，pos emb部分计算结果只与绝对距离有关，而以QWK计算，则没什么直观意义：

改进该部分公式为：

其中：R_{t-j}直接计算了两个token相对距离关系，t-j 是相对距离存正负，cos(-x) = cos(x)捕捉绝对距离关系，sin(-x) = -sin(x)捕捉方向性

关注