链接:https://arxiv.org/pdf/2112.08351.pdf
简介
在任务型对话系统(task-oriented dialog systems)中,有时我们会遇到这样一个问题:
- 对于用户的一个提问或要求,我们可以从数据库中找到多个可能的答案,无法做出决断。
比方说下图:
无论是订宾馆、订酒店,还是买衣服,这种情况在生活中很常见。
我们将这种情况称为数据库搜索结果歧义( database search result ambiguity),简称DSR-ambiguity。
我们通常说的歧义是指一个词或者一句话有多种意思,但DSR-ambiguity指的是我们从数据库中搜到了多个结果。
那么,怎么解决这一问题呢?正如在图中所看到的,一个最简单的办法就是:向用户提问(称为澄清问题),然后理解用户的回答再进行最后选择。
比如图中的Hotel例子,对话系统给了用户两个宾馆,让用户做选择。
然而目前为止,大部分工作集中在何时和如何给出澄清问题,对于理解用户的答案/意图的工作相对较少。本文的重点正在于此。
简单而言,本文找来了两个任务型对话的数据集:MultiWOZ和SchemaGuided Dataset (SGD),原来在这两个数据集里,约66%的问题有多种答案。对其进行增强,从而增强模型的消岐能力。
那么,我们希望对话系统有以下特点:
- 能给用户一些信息,而不是从结果列表中选择一个并推荐给用户。
- 不需要列出所有结果,列举2到3个选项即可。因为这助于提高用户粘性。
具体来说,我们首先从SIMMC 2.0数据集(Kottur等人,2021)中提取模板,这是一个多模态面向任务的对话框数据集,包含消歧转向,但只覆盖两个领域。
基于从MultiWOZ和SGD中提取的模板和数据库,我们合成了一个单回合对话数据集,只包含消歧的对话,以检验模型是否能够从数据中学习消歧
。为了在现实中应用,我们希望该模型能够在不影响其他对话技巧的前提下学习消歧技巧。因此,我们建议在MultiWOZ和SGD中增加消歧对话