【干货笔记】Generating Question-Answer Hierarchies阅读笔记

点击上方,选择星标置顶,每天给你送干货

阅读大概需要5分钟

跟随小博主,每天进步一丢丢

来自 | 知乎

地址 | https://zhuanlan.zhihu.com/p/86593349

作者 | 大葱的kangzhan史

编辑 | 机器学习算法与自然语言处理公众号

本文仅作学术分享,若侵权,请联系后台删文处理

文章:Generating Question-Answer Hierarchies

来源:ACL2019

链接:

https://arxiv.org/pdf/1906.02622.pdf arxiv.org

解决问题:本文介绍了SQUASH(专一性控制问题-答案层次结构)一种新颖且具有挑战性的文本生成任务,可将输入文档转换为有层次结构的问题-答案对。用户可以单击高级问题(例如“ Frodo为何离开研究金?”)来显示相关但更具体的问题(例如“ Frodo谁离开了?”)。

1.贡献:

· 一种根据问题的特殊性对问题进行分类的方法。

· 一种模型,用于控制所生成问题的特异性,这与之前进行QA的工作不同。

· 一种新颖的文本生成任务(SQUASH),它将文档转换为QA对基于特定性的层次结构。

· 用于解决SQUASH的流水线系统以及用于评估它的众包方法。

2.相关工作介绍:

3.模型:

3.1问题分类:

我们将问题分为三个粗糙的标签:GENERAL,SPECIFIC或YES-NO,根据问题的特殊性自动对SQuAD,QuAC和CoQA中的问题进行分类。具体问题通常要求低级别的信息(例如,实体或数字),而一般问题则要求更广泛的概述(例如,“ 1999年发生了什么?”)或因果信息(例如,“为什么……”)。使用简单的模板和规则可以可靠地识别许多问题类别。

对于不满足任何模板或规则的问题,手动标注了1000条数据用CNN分类器进行分类,最终将所有问题都运行了基于规则的方法,并将分类器应用于规则未涵盖的问题。

3.2生成QA对:

pipeline for SQUASH

在训练时,我们使用这些数据集中的真实答案范围作为问题生成器的输入。将输入段落中的所有单个句子视为潜在的答案范围(以生成一般和具体问题),以及所有实体和数字(仅针对具体问题)。

为了提高从句子生成的特殊问题的质量,手动删除了一些非常笼统的问题(例如“本文中发生了什么?”)。其他一些问题(例如“他在哪里出生?”)在数据集中被重复多次;我们将此类问题下采样到最大限制为10。

我们使用两层的biL-STM编码器和单层的LSTM解码器来生成问题(1997),将解码器的特殊性级别设置为“一般”,“具体”和“是-否”。每个答案范围生成十三个候选问题。

3.3形成有层次的QA对:

首先,为每个特殊问题选择一个父项----使每个一般问题的预测答案与预测答案的重叠(词级精度)最大化。如果没有与特定问题的答案重叠的一般问题的答案,我们将其映射到最接近的一般问题----其答案在特定问题的答案之前。

4.实验与评估:

对于我们所有的实验,我们使用BiDAF ++问题回答模型的AllenNLP实现。(2018)在没有对话上下文的情况下对QuAC进行了训练。

4.1生成问题评估:

我们使用各种众包实验在QuAC开发集的文档上评估了SQUASH流程。

第一行显示,产生的问题中有85.8%句法成立;第二行显示,我们的问题中有78.7%与该段落相关,而黄金问题中则有83.3%;第三行和第四行中显示包含问题答案得分

4.2结构正确性评估(抽样):

首先,我们调查我们的模型是否实际上在生成带有正确特异性标签的问题。我们对400个随机抽样的问题(一般50%,特殊50%)运行了特异性分类器(第2部分),并获得91%的高分类精度。这种自动评估表明该模型能够产生不同类型的问题。

为了查看一般问题是否确实提供了更多的高级信息,我们对200个一般-具体问题对进行了抽样。对于每对问题(不显示答案),我们请人群工作者选择问题,如果回答了问题,将为他们提供有关该段落的更多信息。在89.5%的情况下,一般问题优于特定问题,这证实了我们的特异性控制问题生成系统的优势。

5.待解决的问题:

有缺陷的数据集

信息冗余

缺乏世界知识

每个段落有多个一般QA对

交流学习,进群备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值