对话-对话管理
文章平均质量分 92
对话-对话管理
nopSled
一周一更
展开
-
End-to-End Task-Completion Neural Dialogue Systems翻译
摘要模块化任务驱动对话系统的主要缺点之一是每个模块都经过单独训练,这带来了一些挑战。例如,下游模块受上游模块的影响,并且由于错误的累积导致整个系统的性能并不可靠。本文为任务驱动对话系统提出了一种新的端到端学习框架,以解决此类问题。我们的神经对话系统可以直接与结构化数据库交互,以帮助用户访问信息并完成某些任务。基于强化学习的对话管理器提供了强大的功能来处理由对话系统其他组件引起的噪声。我们在电影票...翻译 2020-02-09 15:44:58 · 1102 阅读 · 0 评论 -
POLICY ADAPTATION FOR DEEP REINFORCEMENT LEARNING-BASED DIALOGUE MANAGEMENT翻译
摘要策略优化是统计对话管理的核心部分。深度强化学习已成功用于静态预定义领域的对话策略优化。但是,当领域动态变化时,例如添加了一个之前未见过的新概念(或插槽),并且该概念随后可以用作数据库搜索约束,或者将一个领域的策略转移到另一个领域,对话状态空间和动作空间都将更改。因此,不同领域的模型结构必须不同。这使对话策略的适应/转移具有挑战性。本文提出了一种多agent对话策略(MADP)来解决这些问题。...翻译 2020-01-17 10:18:02 · 387 阅读 · 0 评论 -
Sample-efficient Actor-Critic Reinforcement Learning with Supervised Data for Dialogue Management翻译
摘要深度强化学习(RL)方法具有优化对话策略的巨大潜力。但是,他们在学习的早期阶段表现不佳,对于与实际用户的在线学习而言,这具有很大的问题。引入了两种方法来解决这个问题。首先,为了加快学习过程,提出了两种具有提高样本利用率的神经网络算法:具有经验回放的信赖域actor-critic(TRACER)和具有经验回放的情节自然actor-critic(eNACER)。对于TRACER,信赖域有助于控制...翻译 2020-01-09 10:54:56 · 693 阅读 · 0 评论 -
Continuously Learning Neural Dialogue Management翻译
摘要我们描述了面向任务的口语对话系统中对话管理的两步方法。提出了一个统一的神经网络框架,以使系统能够首先通过监督方法从一组对话数据中学习,然后通过强化学习不断改善其行为,所有这些都在单个模型上使用基于梯度的算法进行。在使用户模拟以及有偿人类受试者中,实验证明了受监督模型在基于语料库的评估的有效性。强化学习的使用进一步提高了两种交互设置下模型的性能,尤其是在高噪声条件下。1.介绍传统上,开发强...翻译 2020-01-03 10:00:34 · 382 阅读 · 0 评论 -
AN AGENDA-BASED DIALOG MANAGEMENT ARCHITECTURE FOR SPOKEN LANGUAGE SYSTEMS翻译
摘要对话管理可以看作是解决两个特定问题的方案:(1)为交互提供连贯的整体结构,将对话扩展到单轮以上;(2)正确管理混合启动交互,允许用户根据自己的指导进行交互(而非必须明确共享)目标,同时允许系统引导交互成功完成。我们提出了一个基于以下要素的对话管理体系结构:关注交互的处理程序,其重点是紧密耦合的信息集;能反映相互确认的信息的产物;以及对与任务完成相关的主题进行排序的议程。1.介绍口语交流可...翻译 2019-12-26 09:40:39 · 626 阅读 · 0 评论