题目:Open Intent Extraction from Natural Language Interactions
来源:WWW2020(最佳论文)
原文链接:https://dl.acm.org/doi/pdf/10.1145/3366423.3380268
转载请注明出处:学习ML的皮皮虾
Introduction
最近NLU的发展带动了一批语音助手的发展,如Apple Siri、Microsoft Cortana、Amazon Alexa等,这类语音助手为了有效地和用户交互,需要识别用户话语的意图,并且基于此产生应答。
随着深度学习的应用,许多研究提出了各种意图检测的模型。这些模型通常将意图分类建模成一个多类别分类任务,将输入的用户话语归到预先定义的意图类别中。然而这样的模型有以下两个问题:它们将意图定义为封闭的,只包含若干类别,因此无法识别训练集中不可见的意图类别;
它们假设一句话中只包含单个意图类别,这和实际情况中,一句话可能包含多个意图的情况不相符。
本文提出了OPINE(OPen INtent Extraction)模型,能够自动发现、识别自然语言中的意图,而无需事先定义好的意图类别集合。它能识别出在训练时没见过的新出现的意图。作者将此类“识别开放意图而无需任何关于意图模式的信息(即知识本体)”的任务称为:开放意图发现(Open Intent Discovery)。作者举了几个例子:Please make a 10:30 sharp appointment for a haircut:包含了单个意图“make a haircut appointment”;
I would like to reserve a seat and also if possible, request a special meal on my flight:包含了多个意图,分别是“a seat reservation”和“a meal request”。
本文的工作仅针对于像上面两个例子那样,具有明确意图和动作的句子,而如“Anyone knows the battery life of iPhone?”这种,没有显式的动作触发词(如make、reserve、request)、以疑问形式表达的、具有歧义的句子则不在本文的考虑范围之内。
一些工作与本文具有类似的目标,即识别标注数据以外的意图。它们中的一些将其定义为zero-shot分类的任务,需要在测试时识别出部分在训练阶段不可见的类别样本;而另一些则是将其作为检测的任务,没有去主动地发现(discover)未知意图类别。除此之外,所有的工作都仅能识别包含单个意图的句子,而本文的模型则没有上述这些限制。
不同于之前的工作(通常将意图识别建模成分类任务),本文将开放意图发现的任务建模成序列标注任务。本文提出的模型结构为BiLSTM + Multi-head self-attention + CRF。为了解决跨领域识别的问题,OPINE将提取出来的意图通过