【论文泛读164】MECT：基于多元数据嵌入的中文命名实体识别交叉变换器

最新推荐文章于 2022-08-30 12:44:16 发布

及时行樂_

最新推荐文章于 2022-08-30 12:44:16 发布

阅读量1.8k

点赞数 1

分类专栏：论文 # NLP_paper 文章标签： paper 部首

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41485273/article/details/118709908

版权

本文提出MECT，一种结合多元数据嵌入的交叉变换器，用于提升中文命名实体识别（NER）性能。MECT在Transformer中融合汉字结构（部首）信息，增强汉字语义理解。实验显示，MECT在多个基准数据集上表现出优越性，证明部首信息对提升Chinese NER效果显著。未来研究将探索更高效的汉字信息集成方式。

摘要由CSDN通过智能技术生成

贴一下汇总贴：论文阅读记录

论文链接：《MECT: Multi-Metadata Embedding based Cross-Transformer for Chinese Named Entity Recognition》

一、摘要

最近，词增强在中文命名实体识别（NER）中变得非常流行，减少了分割错误并增加了中文词的语义和边界信息。然而，这些方法在整合词汇信息后往往会忽略汉字结构的信息。汉字自古由象形文字演变而来，其结构往往反映了更多的文字信息。本文提出了一种新的基于多元数据嵌入的交叉变换器（MECT），通过融合汉字的结构信息来提高中文 NER 的性能。具体来说，我们在双流 Transformer 中使用多元数据嵌入将汉字特征与部首级嵌入相结合。借助汉字的结构特征，MECT可以更好地为NER捕捉汉字的语义信息。在几个著名的基准数据集上获得的实验结果证明了所提出的 MECT 方法的优点和优越性。代码：github。

二、结论

本文提出了一种适用于Chinese NER的新型双流网络，即MECT。该方法使用多元数据嵌入，通过交叉变换网络融合部首、字符和单词的信息。此外，随机注意力被用于进一步提高性能。在四个基准上的实验结果表明，汉字部首信息可以有效提高Chinese NER的性能。

所提出的带有基流的MECT方法增加了模型的复杂性。未来，我们将考虑如何在双流或多流网

最低0.47元/天解锁文章

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。