《Dependency or Span, End-to-End Uniform Semantic Role Labeling》语义角色标注

《Dependency or Span, End-to-End Uniform Semantic Role Labeling》是一篇发表在AAAI会议上的论文,是由云从科技和上海交通大学联合创新实验室关于语义角色标注(SRL,Semantic Role Labeling)的研究成果。论文链接

一、背景介绍

在这里插入图片描述
SRL就是以句子中的谓词为中心,分析句子中各成分和谓词之间的联系。即句子的谓词(Predicate)- 论元(Argument)结构。谓词是对主语的陈述或说明,指出「做什么」、「是什么」或「怎么样,代表了一个事件的核心,跟谓词搭配的名词称为论元。语义角色是指论元在动词所指事件中担任的角色。主要有:施事者(Agent)、受事者(Patient)、客体(Theme)、经验者(Experiencer)、受益者(Beneficiary)、工具(Instrument)、处所(Location)、目标(Goal)和来源(Source)等。

例如:「小明昨天晚上在公园遇到了小红。」

「遇到」是句子的谓词,「小明」是谓词的发起者,角色为「施事者」,「小红」是谓词的接受者,角色是「受事者」,「公园」是谓词的发生地点,据说是「处所」等。
作为自然语言处理的一项基础性任务,语义角色标注能提供上层应用的非常重要的语义信息。例如在阅读理解应用中,把语义角色标注作为输入的一部分,可以帮助阅读理解应用更加准确确定各部分的语义角色,从而提高阅读理解的准确性。

比如:「小明打了小华」和「小华被小明打了」,这两句话语义完全一致,但由于被动语态引起的主语和宾语位置上的变化,当提问「谁挨打了?」时,阅读理解算法在处理这两句时,有可能会给出不同的答案。但如果我们把语义角色标注也作为阅读理解的输入信息,由于两句话中「小华」都是「受事者」角色,问题也是在问「受事者」是谁,这时阅读理解算法往往比较容易给出一致准确的答案。

明确了一个句子中各个成分的语义角色,可以更好的帮助自然语言的理解和处理。比如在「信息提取」任务中,准确的提取出动作的发出者信息;在「阅读问答」中给出事件发生的时间、地点等。因此,语义角色标注时很多自然语言理解与处理任务的基础,对于实现自然语言处理意义非常重要。

传统的语义角色标注是建立在句法分析的基础上的,但由于构建准确的语法树比较困难,基于此方法的语义角色标注准确率并不高,因此,近年来无句法输入的端到端语义角色标注模型受到了广泛的关注。这些模型算法,根据对论元的表示不同,又划分为基于区间(span)和基于依存(dependency)两类方法,不同方法的模型只能在对应的论元表示形式上进行优化,不能扩展、应用到另一种论元表示上。
这篇论文则通过提出一个统一的谓词与论元表示层,实现了将论元表示形式的统一,因此,该模型可以接受不同论元表示形式的数据集进行训练。

两种论元表示方法的区别如下图所示:
在这里插入图片描述
Dependency-based SRL只标注论元的头部而不是整个论元范围

二、Uniform End-to-End Model

在这里插入图片描述

1、Overview

给定一个句子s=w1,w2…wn,我们来预测一个谓词-论元-关系的元组
在这里插入图片描述
其中在这里插入图片描述
在这里插入图片描述
当i=j时,表示dependency
R是语义角色集合

2、Token Represtation and Deep Encoder

在这里插入图片描述
使用了一个biLSTM-CNN架构,使用CNN将一个词w转化成字符级的Wchar表示,然后串上Wword和预训练的ELMo的Welmo
编码器使用了BiHLSTM,将上下文表示转化为特定的任务表示,其中为了避免梯度消失的情况使用了gated highway connections

3、Predicate and Argument Representation

在这里插入图片描述
为了在SRL上下文中区分当前谓词和候选论元,添加了两个多层感知器分别为论元和谓词表示,为了体现统一的SRL,本文提出了统一的谓词和论元表示层。对于dependency SRL,直接使gf = ga。对于span SRL则如上图所示。
在这里插入图片描述
是这个span的范围,size是这个span的大小,h是注意力加权平均的词向量,计算公式如上图所示。

4、Scores

在这里插入图片描述
模型通过对谓词、论元评分,以及谓词和论元的一个双仿射变换,同时实现了对谓词的识别、以及谓词与论元的联合预测

5、Training Objective

在这里插入图片描述
这个模型的目标是给定一个句子,优化y属于元组Y的可能性

三、实验

作者分别做了在预先给定谓词和不给定谓词的四次实验,然后将本模型中span-based和dependency-based做了实验对比,最后结论是dependency-based效果更好

四、结论

拓展了已有的模型,通过双仿射分数引进统一参数表示统一的span和dependency的SRL表示形式,实验证明这是可行的,这为以后能够方便的探索两种语义表征形式之间的有用联系

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Maven插件是一种可插拔的工具,可以在Maven构建过程中执行特定的任务。其中,maven-dependency-plugin和maven-surefire-plugin是两个常用的插件。 maven-dependency-plugin插件可以用来管理项目依赖,可以帮助我们列出项目中的依赖关系,复制依赖文件到指定目录,解压依赖文件等。常用的配置包括: - list:列出项目依赖 - copy-dependencies:将所有依赖文件复制到指定目录 - unpack:解压指定的依赖文件 maven-surefire-plugin插件则是用来执行项目的单元测试的。它可以在Maven构建过程中自动执行单元测试,并生成测试报告。常用的配置包括: - includes/excludes:指定要执行的测试类或排除的测试类 - parallel:指定测试是否并行执行 - reportsDirectory:指定测试报告生成的目录 在POM文件中配置这两个插件,可以通过以下方式: ``` <build> <plugins> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-dependency-plugin</artifactId> <version>3.2.0</version> <executions> <execution> <id>copy-dependencies</id> <phase>package</phase> <goals> <goal>copy-dependencies</goal> </goals> <configuration> <outputDirectory>${project.build.directory}/lib</outputDirectory> </configuration> </execution> </executions> </plugin> <plugin> <groupId>org.apache.maven.plugins</groupId> <artifactId>maven-surefire-plugin</artifactId> <version>3.0.0-M5</version> <configuration> <includes> <include>**/*Test.java</include> </includes> <parallel>methods</parallel> <threadCount>10</threadCount> <reportsDirectory>${project.build.directory}/surefire-reports</reportsDirectory> </configuration> </plugin> </plugins> </build> ``` 以上是一个简单的POM文件中Maven插件配置maven-dependency-plugin和maven-surefire-plugin的示例,其中maven-dependency-plugin在package阶段执行复制依赖文件的任务,maven-surefire-plugin在test阶段执行单元测试。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值