《Global Attention Decoder for Chinese Spelling Error Correction》阅读记录

最新推荐文章于 2022-07-26 13:32:01 发布

帅气的琳仔

最新推荐文章于 2022-07-26 13:32:01 发布

阅读量406

点赞数

分类专栏：论文阅读文章标签：自然语言处理深度学习

本文链接：https://blog.csdn.net/weixin_42546799/article/details/120635149

版权

Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021

摘要

近期BERT在CSC中的应用大多基于局部上下文信息，对词进行修正。

该方法：

Global Attention Decoder (GAD)：潜在正确输入字符与潜在错误输入字符候选字符间的全局关系【获取更丰富的全局上下文信息，减轻局部错误上下文影响】
A BERT with Confusion set guided Replacement Strategy（BERT_CRS）：带有混淆集引导替换策略的BERT，缩小与下游任务CSC间的距离。
- 生成的候选字符覆盖正确字符概率＞99.9
- 比其他模型性能高处6.2%，SOTA

三个数据集上实验表明，BERT_CRS优于以往所有最先进方法，与GAD结合获得了更高的性能。

CSC的主要方法：

随着预训练BERT模型出现，取得了更大进展 (Hong et al., 2019; Zhang et al., 2020;
Cheng et al., 2020) ，几乎所有方法都利用了混淆集（音/视相似）

(Yu and Li, 2014)基于候选集生成候选字符，并找出语言模型判断概率最高的候选字符。

(Cheng et al., 2020)使用卷积网络，利用混淆集捕捉字符之间的相似性和先验依赖关系。

(Wang et al., 2019)提出了一种从混淆集生成字符的指针网络。

之前方法基于含有噪声或其他错误的局部上下文信息来预测每个字符或单词。

流程：

关注