[AAAI2022]Sequence-to-Action: Grammatical Error Correction with Action Guided Sequence Generation

nqct1

已于 2023-10-27 10:58:06 修改

阅读量205

点赞数

分类专栏：论文阅读文章标签：论文阅读语言模型

于 2023-09-12 10:49:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45978862/article/details/132823868

版权

论文阅读专栏收录该内容

8 篇文章 0 订阅

订阅专栏

关键词： Grammatical Error Correction（GEC）、over-correction、seq2seq、sequence tag model、 Sequence-to-Action (S2A)、汉语和英语

大致思路：结合了seq2seq以及sequence tag model两种模型的优点，避免过度校正，以及摆脱人工标注的限制。

研究动机

（1）seq2seq 模型有过度校正的问题
（2）sequence tag model模型可以解决过度校正的问题（通过生成编辑操作），但其限制是需要依赖人类设计特定语言标记标签。

具体方法

结合上述两者，利用它们的优点，缓解缺点。
框架如下：
在这里插入图片描述

输入的构建

（1）生成integrated sequence z 和 a sequence的过程是一个动态规划的过程；
在这里插入图片描述
（2）构建S2A的输入、 Decoder的输入、以及目标序列（输出）。
算法流程

空白令牌 [BLK]
这里涉及到teaching force的技巧：将右移版本的y˜作为decoder输入y˜。
【teaching force可以理解为老师直接教，直接给你答案】
在seq2seq的结构中，有一个decoder的结构如下。这个带来的问题是上一个神经元出错就会导致下一个出错，所以不如直接给“答案”，也就是正确的输入序列。

参考：
seq2seq的三种结构： https://www.jianshu.com/p/80436483b13b

训练过程

（1）S2A部分loss函数

S2A 是两层前向网络 FFN
优化目标为：
在这里插入图片描述

最终式子：

（2）s2s模型部分loss函数
在这里插入图片描述
（3）最终的Loss函数：

推理过程

和seq2seq模型类似。
输入源句子x，然后得到输出y（这里是y˜out）

实验

英语方面模型的比较：
在这里插入图片描述
上下两组区别在于是否pretrain

在这里插入图片描述
上下两组区别在于是否data augmentation【数据增强】

从结果上看，指标略有提升。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。