语义之难,一直被誉为语言学的黑洞和流沙。而语义的自动分析,一直是计算语言学和自然语言处理不断追寻和攻克的目标。到底哪种语义描写和表示体系适合自然语言?在不同的语言上表现得如何?本届评测堪称有史以来最前卫的探索,汇集了计算语言学界最新的5种语义表示体系,在英语、汉语、捷克语、德语四种语言的大规模深度标注语义信息的语料库上展开评测。评测在疫情中开展,主办方和各参赛队克服了诸多困难,在理论的探索、资源建设、计算建模方法、模型优化、评测方法上都取得了重大进展。
CoNLL2020的跨框架多语言语义分析评测任务MRP2020刚刚结束,会议将和CoLing2020一起在线召开。
会议网站 http://mrp.nlpl.eu/2020/index.php?page=16
2020年11月19日周四下午 6:45-8:45
10:45–11:15 UTC (北京时间18:45-19:15) | MRP 2020: The Second Shared Task on Cross-Framework and Cross-Lingual Meaning Representation Parsing Stephan Oepen, Omri Abend, Lasha Abzianidze, Johan Bos, Jan Hajič, Daniel Hershcovich, Bin Li, Tim O’Gorman, Nianwen Xue, Daniel Zeman |
11:15–11:20 UTC | DRS at MRP 2020: Dressing up Discourse Representation Structures as Graphs Lasha Abzianidze, Johan Bos, Stephan Oepen |
11:20–11:25 UTC | FGD at MRP 2020: Prague Tectogrammatical Graphs Daniel Zeman, Jan Hajič |
11:25–11:28 UTC | Hitachi at MRP 2020: Text-to-Graph-Notation Transducer Hiroaki Ozaki, Gaku Morio, Yuta Koreeda, Terufumi Morishita, Toshinori Miyoshi |
11:28–11:31 UTC | ÚFAL at MRP 2020: Permutation-invariant Semantic Parsing in PERIN David Samuel, Milan Straka |
11:31–11:34 UTC | HIT-SCIR at MRP 2020: Transition-based Parser and Iterative Inference Parser Longxu Dou, Yunlong Feng, Yuqiu Ji, Wanxiang Che, Ting Liu |
11:34–11:37 UTC | HUJI-KU at MRP 2020: Two Transition-based Neural Parsers Ofir Arviv, Ruixiang Cui, Daniel Hershcovich |
11:37–11:40 UTC | JBNU at MRP 2020: AMR Parsing Using a Joint State Model for Graph-Sequence Iterative Inference Seung-Hoon Na, Jinwoo Min |
11:40–12:10 UTC | Final Discussion: Beyond MRP 2020 (Everyone) |
12:15–12:45 UTC | Poster-Like Session on Gather.Town (Everyone) |
本届评测看点:
语义分析精度有了较大提升,英文AMR从之前最好的78%提升到82%,中文AMR从之前最好的61%提升到80%。
这是我们南京师范大学文学院中文信息处理研究组第一次为国际评测提供训练和测试数据,中文AMR语料库共计1.8万句(42万词),为推进中文的句子语义自动分析技术研究贡献自己的一份力量。研究生刘依欢(已毕业)、闻媛(已毕业)、宋丽(已毕业)、霍凯蕊、黄彤、闫培艺、戴玉玲进行了细致的语料标注和校对工作。研究生肖力铭进行了程序设计、自动纠错等工作。在此对他们的努力致谢!
背景信息
评测时间表:
6月22日, 可下载训练数据和配套数据
7月20日至8月3日,评测数据发布,正式比赛
9月7日,提交参赛报告的论文
11月19日,会议正式举办,参会讨论。
评测目标
虽然句法分析长期以来一直被树结构所支配,但人们对图结构越来越感兴趣,因为它的表示能力更强,可以说更适合于句子层次的分析,不是表面的语法结构,而注重对语义结构的表示。本次评测任务的主要目标是将由数据驱动的句法分析推进到句子的语义图结构的自动解析。本次评测采用图结构的五种不同理论框架,在英语、汉语、德语、捷克语四种语言上,用图结构表示语义,分别形成了训练和测试语料库。
该任务旨在减少语义表示分析领域中特定于框架的过拟合问题,寻找通用的基于图结构的语义分析算法。具体可分为以下四点:
a) 在不同语义图上的统一分析模型;
b) 统一表示形式和与框架无关的评分;
c) 跨框架的自动分析系统对比评估;
d) 通过迁移和多任务学习提高使用率。
多框架
该任务涵盖了PTG、EDS、UCCA、AMR、DRG等5种语义表示框架,每种框架都将自然语言表示成图结构来表达特定的语义特性,具体如下:
·Prague Tectogrammatical Graphs (Haji et al., 2012)
·Elementary Dependency Structures (Oepen & Lønning, 2006)
·Universal Conceptual Cognitive Annotation (Abend & Rappoport, 2013)
·Abstract Meaning Representation (Banarescu et al., 2013)
·Discourse Representation Graphs (Bos et al., 2017)
(一)PTG
布拉格构造(语义)图(其实就是语义层依存树简化而来)运用了功能生成描写框架,使用双词汇依存图的形式构造了核心谓词的参数结构,尽管引入了empty节点,但是该节点没有对应的表层标记。
(二)EDS
基本依存结构在无变量语义依存图中编码英语语义,其中图节点对应逻辑谓词,原则上独立于表层词汇单元,边对应标记的参数位置,在某种程度上和抽象语义表示很像。
(三)UCCA
通用概念认知标注框架使用有向无环图(DAG)来表示语义结构,最小的有意义单元在DAG的叶子上,被称为terminal,图的节点叫units,Categories在图的边上标出,表示着组成父单元语义的派生单元的角色。
(四)AMR
抽象语义表示将一个句子的语义抽象为一个单根有向无环图,其中句子中的实词抽象为概念节点,实词之间的关系抽象为带有语义关系标签的有向弧,且忽略虚词和由形态变化体现的较虚的语义(如冠词、单复数、时态),允许增加、删除或修改概念。
(五)DRG
语篇表征图提供了语篇表征结构(DRS),是语篇表征理论的核心。可以处理一些具有挑战性的比如如量词、否定等语义表示问题,还可以转换成一阶逻辑公式,便于逻辑推理。
多语言数据
PTG图和EDS图是在完全相同的语料上进行标注,选自在宾州树库中的华尔街日报相关语料,其中标注语料的句子和标签是对齐的。UCCA的语料来自于英语网络树库中的网络评论文本以及维基百科中关于名人的文章。原则上UCCA结构不局限于一个句子,但是还是被切分成了单个句子来进行标注。AMR语料来自各式各样的文本,其中大多数句子来自于网络论坛,训练语料还包括新闻、民间故事、小说和维基百科文章。
英文数据集
其他三种语言数据集,包括中文AMR(布兰迪斯大学和南京师范大学联合构建)、德文UCCA和DRG、捷克文PTG。