Countering the Influence of Essay Length in Neural Essay Scoring学习

《 神经网络作文评分中作文长度的影响》学习总结

1. Introduction

前人认为AES系统不能依赖于论文长度,这是一个与写作熟练程度无关的因素。

2.Contribution

  • 我们首先表明,即使是神经作文评分系统也可能受到标准数据集中作文长度和分数之间的相关性的影响。
  • 其次,我们证明了在不考虑文章长度的情况下考虑文章内容可以提高神经文章评分系统的性能。
  • 通过评估输入文章和分配了不同分数的文章中的单词分布的相似性来考虑文章内容

3.Models

  • 一种操纵文章长度的神经模型:
    为了考察文章长度的影响,我们提出了一个简单的控制文章长度的神经模型,该模型由平均的RNN输出组成。我们不是用文章的实际长度来归一化RNN输出的总和,而是用提示中的平均文章长度来归一化它们。人们的直觉是,按照平均文章长度来归一化,会对较短的文章造成不利影响。由于一篇作文的符号数量较少,因此它们的RNN输出数量也较少,而相同的分母适用于同一提示中的所有作文。这使得一个简单的RNN模型能够更好地捕捉到文章长度的影响。

  • 一种评价文章内容相似性的神经模型:
    我们提出了一个神经模型,该模型通过评估输入文章和分成三个不同级别:低、中、高三个不同级别的文章中的单词分布的相似性来考虑文章内容。将分数分成三个级别使模型能够处理每个数据集的不同分数范围。

4.Data Sets

本次实验包括两个数据集:ASAPTOEFL
TOEFL是非外国学生进入大学的标准英语考试。这一数据集并未普遍用于AES,而已被用作另一项共享任务–母语识别的标准数据集。
ASAP数据集地址:https://www.kaggle.com/c/asap-aes

5.Result

在这里插入图片描述
在这里插入图片描述
该方法在ASAP数据上 QWK 0.786,在TOEFL数据上Acc 0.728。神经作文评分系统应该关注文本质量,同时应该考虑目标数据集的特征。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值