《LEARNING END-TO-END GOAL-ORIENTED DIALOG》

最新推荐文章于 2022-09-09 17:37:41 发布

hellozgy

最新推荐文章于 2022-09-09 17:37:41 发布

阅读量688

点赞数 1

分类专栏：对话系统

本文链接：https://blog.csdn.net/u012852385/article/details/100856206

版权

论文《LEARNING END-TO-END GOAL-ORIENTED DIALOG》构建了7个数据集，包括模拟和真实对话，用于评估任务型对话系统。研究发现，基于端到端记忆网络（MemN2N）的模型在解决开放词汇问题和提供相关信息方面表现出色。数据集涵盖从获取餐厅信息到处理用户更新和建议的各种任务，旨在模拟和挑战真实世界场景。

摘要由CSDN通过智能技术生成

出处：ICLR 2017

贡献

为了验证end2end的任务型对话系统的效果，论文构建了7个在线订餐的数据集，包括：
- 5个模拟的数据集
- 1个DSTC2（Dialog State Tracking Challenge）改造过来的真实数据集
- 1个真实用户和真人操作员之间的真实数据集
作者在这些数据集上进行了多种模型的实验，包括基于规则的系统、基于经典信息抽取的方法、有监督embeddings方法、end2end的记忆网络MemN2N，并得出记忆网络效果最好的结论。

数据集

地址：http://fb.ai/babi

5个模拟数据集
数据集格式如下：
每个任务包括训练集+验证集+测试集三个语料，每个语料有1000个对话。对话之间用空行隔开，同一个对话用id标识每一轮，每一轮一行，包括用户说话和bot说话，用\t隔开。句子中以<SILENCE>开头的是需要预测的句子。此外。每个任务还包括一个有OOV词的测试集，即存在不在训练集出现过的实体名，但是在kb(知识库)出现过。5个任务共用一个kb，即文件dialog-babi-kb-all.txt，里面记录了每个餐厅的位置、电话、档次等信息；此外还共用一个候选句子库，即文件dialog-babi-candidates.txt，该文件包括5个task里面所有训练集+验证集+2个测试集里面bot说的话。因此任务是从候选句子中选出<SILENCE>最可能的句子，而不是逐词生成<SIL