《Read, Listen, and See: Leveraging Multimodal Information Helps Chinese Spell Checking》阅读记录

最新推荐文章于 2023-09-05 22:06:36 发布

帅气的琳仔

最新推荐文章于 2023-09-05 22:06:36 发布

阅读量1.3k

点赞数 2

分类专栏：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42546799/article/details/118343973

版权

论文地址：https://arxiv.org/abs/2105.12306

来源：ACL （国际计算语言学协会年会）Findings 2021

时间：2021.5.26

摘要

中文拼写检查（Chinise Spell Checking, CSC）：
- 目的：检测和纠正用户生成的中文文本中的错误字符。
- 大多数汉语拼写错误误用方面如下，使用相似关系解决，大多为启发式或人工困惑集：
  - 语义
  - 语音
  - 图形
这篇论文提出REALISE，利用了汉字的多模式信息，预测正确的输出。
- 捕捉输入字符的语义、语音和图形信息
- 有选择地混合这些形式的信息

结论

REALISE模型使用特定的语义、语音和图形编码器捕捉这些形式的信息，并提出一种选择性模态融合机制控制这些模态的信息流。

SIGHAN基准显示，提出的算法比仅适用文本信息的基线模型具有更大优势，使用听觉和视觉信息有助于汉语拼写检查任务。

介绍

CSC广泛应用

搜索查询校正 (Martins and Silva, 2004; Gao et al., 2010)
光学字符识别 (Afli et al., 2016)
论文自动评分 (Dong and Zhang, 2016)

CSC进展

(Zhang et al., 2020; Cheng et al.,2020) 取得很大进展。
(Devlin et al., 2019; Liu et al., 2019; Y ang et al., 2019)应用了大型预处理语言模型

中文拼写检查难点

相比于英语中拼写错误为单词无效，汉字都是有效的，拼写错误是误用（语义、语音、图形）。

REALIES模型简介

思想：使用文本、声音、视觉三个编码器学习信息表示。
构成：
- 采用BERT(Devlin et al., 2019) 作为语义编码器的主干捕获文本信息。
- 对于声音（声学）形态，使用汉语拼音作为特征。使用分层编码器处理字符级和句子拼音字母。
- 对于视觉形态，构建了多通道字符图像作为图形特征，每个通道对应一个特定的中文字体，使用ResNet对图像进行分块编码，得到字符图形标识。
选择性模态融合机制（融合为紧凑的多模态表示，每个模态有多少信息流向混合表示）
预测在相应模态中给定输入的正确字符预训练语音和图形编码器（预训练-微调被证明为有用(Devlin et al.,2019; Dong et al., 2019; Sun et al., 2020））。

实验简介

SIGHAN基准，远远超过了所有以前最先进的模型。

使用混淆集 (Lee et al., 2019)捕捉字符相似关系的方法，如达到SOTA的SpellGCN：
- REALISE在检测和校正水平上，F1平均提高2.4%和2.6%
- REALISE对混淆集中未定义的错误表现的更好。

本文贡献

我们建议除了文字语义之外，还利用汉字的语音和图形信息来完成CSC任务
引入选择性融合机制整合多模态信息
我们提出声学和视觉预处理任务，以进一步提高模型性能
在SIGHAN CSC基准上取得了最佳结果。

相关工作

Chinese Spell Checking研究历程

使用规则处理错误(Chang et al.,2015; Chu and Lin, 2015)
传统机器学习方法——条件随机场、隐马尔科夫模型l (Wang and Liao, 2015; Zhang etal.,2015)
基于神经的方法——将CSC任务视为一个序列标注问题，双向LSTM预测正确字符（Wang et al. (2018)）
大规模预处理语言模型

最低0.47元/天解锁文章

帅气的琳仔

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
《Read, Listen, and See: Leveraging Multimodal Information Helps Chinese Spell Checking》阅读记录

摘要中文拼写检查（Chinise Spell Checking, CSC）：目的：检测和纠正用户生成的中文文本中的错误字符。大多数汉语拼写错误误用方面如下，使用相似关系解决，大多为启发式或人工困惑集：语义语音图形这篇论文提出REALISE，利用了汉字的多模式信息，预测正确的输出。捕捉输入字符的语义、语音和图形信息有选择地混合这些形式的信息结论REALISE模型使用特定的语义、语音和图形编码器捕捉这些形式的信息，并提出一种选择性模态融合
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。