snips数据集_《自然语言交互中的开放意图抽取》阅读笔记

题目:Open Intent Extraction from Natural Language Interactions

来源:WWW2020(最佳论文)

原文链接:https://dl.acm.org/doi/pdf/10.1145/3366423.3380268

转载请注明出处:学习ML的皮皮虾

Introduction

最近NLU的发展带动了一批语音助手的发展,如Apple Siri、Microsoft Cortana、Amazon Alexa等,这类语音助手为了有效地和用户交互,需要识别用户话语的意图,并且基于此产生应答。

随着深度学习的应用,许多研究提出了各种意图检测的模型。这些模型通常将意图分类建模成一个多类别分类任务,将输入的用户话语归到预先定义的意图类别中。然而这样的模型有以下两个问题:它们将意图定义为封闭的,只包含若干类别,因此无法识别训练集中不可见的意图类别;

它们假设一句话中只包含单个意图类别,这和实际情况中,一句话可能包含多个意图的情况不相符。

本文提出了OPINE(OPen INtent Extraction)模型,能够自动发现、识别自然语言中的意图,而无需事先定义好的意图类别集合。它能识别出在训练时没见过的新出现的意图。作者将此类“识别开放意图而无需任何关于意图模式的信息(即知识本体)”的任务称为:开放意图发现(Open Intent Discovery)。作者举了几个例子:Please make a 10:30 sharp appointment for a haircut:包含了单个意图“make a haircut appointment”;

I would like to reserve a seat and also if possible, request a special meal on my flight:包含了多个意图,分别是“a seat reservation”和“a meal request”。

本文的工作仅针对于像上面两个例子那样,具有明确意图和动作的句子,而如“Anyone knows the battery life of iPhone?”这种,没有显式的动作触发词(如make、reserve、request)、以疑问形式表达的、具有歧义的句子则不在本文的考虑范围之内。

一些工作与本文具有类似的目标,即识别标注数据以外的意图。它们中的一些将其定义为zero-shot分类的任务,需要在测试时识别出部分在训练阶段不可见的类别样本;而另一些则是将其作为检测的任务,没有去主动地发现(discover)未知意图类别。除此之外,所有的工作都仅能识别包含单个意图的句子,而本文的模型则没有上述这些限制。

不同于之前的工作(通常将意图识别建模成分类任务),本文将开放意图发现的任务建模成序列标注任务。本文提出的模型结构为BiLSTM + Multi-head self-attention + CRF。为了解决跨领域识别的问题,OPINE将提取出来的意图通过

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值