论文阅读:Overview of the NLPCC 2018 Shared Task: Grammatical Error Correction
**摘要:**本文,我们综述了NLPCC 2018的语法修正(GEC)任务。详细的定义了任务的说明、训练数据以及评估方法。我们还总结了参与者的处理方法。这些方法证明了汉语语法纠错的水平。数据以及评估工具在https://github.com/zhaoyyoo/NLPCC2018_GEC提供下载。
1. 引言
GEC在NLP中是具有挑战性的任务,它也受到了越来越多的关注。今年,我们组织了第一次中文语法纠错任务,众多关注中文学习者的语法错误。具体的说,我们的任务是监检测非母语学者写的文章中的语法错误,并修正。之前对于中文语法错误的研究只要集中在错误检测,二我们共同的任务还包括自动纠正这些语法错误。尽我们所能,我们为这个中文GEC任务提供了第一个基准数据。
该任务的目标是开发一个工具去自动检测并纠正在学习中文的CSL(以中文为第二语言Chinese as a Second Language)。我们提供了一个大规模的非母语学者写的中文文章,其中的错误已被母语学者注释,并修正。使用统一的评测工具与评测指标以及盲测数据用于测评参与团队的结果。
一共有23支队伍报名了任务,只有6支队伍提交了他们的结果。这份综述文章详细说明了这个任务,并按以下内容展开:第二节给出了任务的定义;第三节详细介绍了数据集以及注释标准;第四节提供了评价指标;第五节结束了来自参与者的不同方法;第六届展示了最终的结果;第七节给出了综述的结论。