【emnlp 2021】Grammatical Error Correction with Contrastive Learning in Low Error Density Domains

最新推荐文章于 2024-08-14 19:25:49 发布

nqct1

最新推荐文章于 2024-08-14 19:25:49 发布

阅读量409

点赞数 8

文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45978862/article/details/132832798

版权

本文探讨了如何使用监督对比学习(SupervisedContrastiveLearning,CL)改进机器翻译纠错系统(GEC)，通过调整loss函数和负样本策略，实验表明CL在提高纠正正确性及区分错误纠错方面效果优于传统方法，尤其是在处理英语母语者错误(IE)时表现突出。

摘要由CSDN通过智能技术生成

关键词：英语、GEC、

研究动机：

大部分纠错是针对ESL（英语作为第二语言的人群），然而对于英语作为母语的人群而言可能不太好用（也就是出现错误比较少）。

背景知识：

supervised contrastive learning (CL) 【SimCLR】：这使得模型可以通过将正样本的特征与负样本的距离更近来学习鉴别特征。

大致思路：

利用CL实现目的：增加模型产生正确纠错的概率和降低产生错误纠错的概率。这里主要对loss和负样本采样做了工作。
loss函数：
● negative log likelihood (NLL) loss 增加正确纠错概率【最大化此概率】
● margin-based CL loss【拉大正确纠错与错误纠错的差距】
负样本的产生：
● 第一种负样本是由GEC模型在波束搜索过程中以高概率产生的错误校正组成的
● 第二类负样本由来自数据集的错误句子组成。

loss函数

GEC

t：target（正确句）； s：source（错句）
在这里插入图片描述

最佳的target 利用beam search得到。

加入对比学习

三个步骤：训练（目前有的大量数据集，高错误密度数据集）+构建负样本+预训练（低错误密度数据集上）

在这里插入图片描述

负采样方法

第一种负样本是由GEC模型在Beam Search过程中除了最佳的那个，其余作为负样本【这样的负样本才有区分的难度】
第二类负样本由来自数据集的错误句子组成，也就是<S,S>

实验

model——seq2seq架构（还是比较适合用对比学习的）

GEC-PD （基于Transformer）
GEC-BART（BART-large）

结果：
在这里插入图片描述
整体来说，是CL的效果更好，准确率高。

在这里插入图片描述
错误细分的话：OE和IE相较来说CL普遍更好；其中对于IE（ignore Error）的处理效果更明显。

关注

8
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
【emnlp 2021】Grammatical Error Correction with Contrastive Learning in Low Error Density Domains

关键词：英语、GEC、
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。