基于卷积注意力神经网络的命名实体识别（CAN-NER）

最新推荐文章于 2024-05-24 23:54:15 发布

SYSU_BOND

最新推荐文章于 2024-05-24 23:54:15 发布

阅读量1.8k

点赞数

分类专栏：实体识别论文阅读文章标签： NER 实体识别

本文链接：https://blog.csdn.net/SYSU_BOND/article/details/117376888

版权

12 篇文章 0 订阅

订阅专栏

5 篇文章 1 订阅

订阅专栏

该论文提出过去基于词向量和词典中的几个问题：

目的在于encode char和潜在词【encode the sequence of input characters and implicitly group meaning- related characters in the local context】
每个字符x=[char ; BMES；pos]组成
感觉文章表述的Conv Attention就是一个窗口大小为kernel size的Local的Self-Attention而已：

attention权值由输入emb计算

得到权值后对emb进行加权求和，就是这一层的输出了

然后这里说有多个kenel，结果算完后进行sum-pool，但感觉也就是一个multi-head

文章没有使用word emb，而是直接使用分词边界BMES作为char的特征输入到模型中，确实有一定的作用，不过，这样模型是要基于分词的，这又与基于词典的模型不同
感觉这里的Attention只是为了强行套上去的，尤其是最后一层BiGRU还要加Attention，实验也没说明这个作用体现在哪？
而在效果上，其实这个模型对比Lattice-LSTM提升很小

关注

专栏目录