论文慢递2：PLOME: Pre-training with Misspelled Knowledge for Chinese Spelling Correction

最新推荐文章于 2024-07-25 12:03:04 发布

塞外花岗岩

最新推荐文章于 2024-07-25 12:03:04 发布

阅读量816

点赞数

分类专栏： NLP论文慢递文章标签：自然语言处理深度学习语音识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43410601/article/details/120128821

版权

NLP论文慢递专栏收录该内容

5 篇文章 0 订阅

订阅专栏

目录

abstract
方法

abstract

将拼写错误知识加入到预训练掩码语言模型，使用修正混淆集来代替预测掩码，加入语音级和字形级信息来辅助模型学习纠错；

方法

语音字形纠错

模型结构

将拼音与笔画加入embedding层辅助
请添加图片描述

基于混淆集的掩码策略

相较于bert直接MASK，采用混淆集辅助MASK，通过形近和音近字进行掩码使模型纠错有的放矢；除此之外，为了增加模型鲁棒性，还有概率进行随机掩码；为了防止模型总是倾向于纠错，也有概率维持不变；
请添加图片描述

嵌入层

通过GRU编码字音与字形信息（通过拼音与笔画）
请添加图片描述

Encoder层

基本与BERT相同

Output层

由上文中的模型结构图可知，模型对字的字形与字音均进行了预测；

对于字形预测，预测正确的概率为
$p_c(y_i=j|X)=softmax(W_ch_i+b_c)[j]$
对于拼音预测，预测正确概率为：
$p_p(g_i=k|X)=softmax(W_ph_i+b_p)[k]$

训练方法

分为字形与拼音损失：
$L_c=-\sum_{i=1}^n log p_c(y_i=l_i|X)$
$L_p=-\sum_{i=1}^n log p_p(g_i=r_i|X)$
训练阶段损失为：
$L=L_c+L_p$

finetune

训练参照训练方法，预测阶段采用两概率乘积表示该字最终概率：
$p_j(y_i=j|X)=p_c(y_i=j|X)\times p_p(g_i=j^p|X)$
最终联合概率分布可以表示为：（其中 $\in R^{n_c \times n_p}$ ）
$p_j(y_i|X)=[p_p(g_i|X)\cdot I^T]\odot p_c(y_i|X)$

塞外花岗岩

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
论文慢递2：PLOME: Pre-training with Misspelled Knowledge for Chinese Spelling Correction

目录abstract方法模型结构基于混淆集的掩码策略嵌入层Encoder层Output层训练方法finetuneabstract将拼写错误知识加入到预训练掩码语言模型，使用修正混淆集来代替预测掩码，加入语音级和字形级信息来辅助模型学习纠错；方法模型结构将拼音与笔画加入embedding层辅助基于混淆集的掩码策略相较于bert直接MASK，采用混淆集辅助MASK，通过形近和音近字进行掩码使模型纠错有的放矢；除此之外，为了增加模型鲁棒性，还有概率进行随机掩码；为了防止模型总是倾向于纠错，也有概
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。