Applying Rhetorical Structure Theory to Student Essays for Providing Automated Writing Feedback

原论文

动机

作文结构方面的反馈可以帮助写作者建立一个清晰的结构,从而组织好作文中的句子和段落。

现有的作文评分的系统有的仅仅得到一个分数。有的只给出单个句子结构反馈,或者反馈不具有改进指导意义

论文贡献

  1. 提供了一个修辞结构理论RST的标注资源包,可以用来标注学生作文
  2. 强调了修辞结构理论RST自动提供有效作文反馈方面的巨大潜力

获得语料

虽然已经有修辞结构理论的语料,但是可能和学生作文关系不大。论文从作文自动反馈系统网站重新收集获取了学生英文作文语料

标注目标

论文认为一篇结构好的作文,应该会在各个部分之间建立有意义的关系。当不能识别到有意义的关系时,就需要对作文结构进行修改。

自动生成结构方面反馈的目标是通过重新组织结构,让学生知道应该做哪些改进

作文RST结构的一个例子:
在这里插入图片描述

RST结构的叶子节点是EDU(Elementary Discourse Units),论文中将一句话作为EDU,在原始的RST结构中使用更小的粒度。

多个EDU通过修辞关系组成一个文本段text span。上图包含6个EDU(28-33)和4个文本段(29-31, 28-31, 32-33, and 28-33)

首先将作文分句,然后按照一定的结构组织成作文,最后给出反馈

标注细节

为了适应作文数据,将原始的RST的修辞关系做了一些改变,并且数据集因为隐私问题不会放出。主要标注以下三种单元EDUs, text spans, paragraphs。修辞关系有以下三类:

NN = 两个EDU都是核心(多核心关系)
NS = 左边的EDU是核心,右边的EDU是卫星
SN = 左边的EDU是卫星 右边的EDU是核心

文献Rhetorical Structure Theory: A Theory of Text Organization提出了23种修辞关系,论文在这些修辞关系的基础上,对下图所示修辞关系,做了一些合并消除改变等操作。
在这里插入图片描述

虽然这些改变看起来很随意,但作者认为有必要在标注过程中做出这些改变,以减少混淆,增加标注的可靠性。

标注流程:

  1. 将作文分割成EDU
  2. 识别每个paragraph种的中心思想,并找出对应的EDU
  3. 从左到右,识别paragraph种两个相邻EDU之间的修辞关系。首先需要评判两个EDU之间是否同样重要,更重要的EDU是核心,另一个是卫星;如果同等重要,则两个EDU都是核心。然后根据修辞关系的定义,给出两个EDU之间的关系,例如NS-elaboration
  4. 识别两个文本段text-span之间的修辞关系,同第3步
  5. 识别不同paragraph之间的关系,同第3步,如果修辞关系是Joint,代表两个段落之间关系不大

在这里插入图片描述

标注系统,以三种RST修辞关系为例,从上到下包括修辞关系definitions, 修辞关系对应的例句对, 修辞关系对应的连接短语, 和修辞关系所属的更高层的修辞关系

在这里插入图片描述

从RST结构获得反馈

连贯指的是文章中的句子是如何连接的,以及文章是如何组织的。
RST可用于提供可操作的写作反馈,以提高传统的自动连贯评分不足

以第一个图种的RST结构为例,修辞关系Joint代表低连贯性。图中有两个文本段,但是者两个文本段没有清晰的连在一起。

文本段28-31列出了加入俱乐部的三个好处,文本段32-33可能想表达鼓励人们加入俱乐部,但意图并不明确,因为没有提到加入俱乐部。

另外,在特定的作文体裁方面,提供反馈,结合修辞关系,也可以指导高质量的写作。

个人评价

  1. 标注的数据集未公开
  2. 仅仅举了一个Joint代表低连贯性的例子,对于其他修辞标签该如何判断连贯性呢?
  3. 最终整体的连贯性该怎么获得
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旺旺棒棒冰

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值