《LEARNING END-TO-END GOAL-ORIENTED DIALOG》

论文《LEARNING END-TO-END GOAL-ORIENTED DIALOG》构建了7个数据集,包括模拟和真实对话,用于评估任务型对话系统。研究发现,基于端到端记忆网络(MemN2N)的模型在解决开放词汇问题和提供相关信息方面表现出色。数据集涵盖从获取餐厅信息到处理用户更新和建议的各种任务,旨在模拟和挑战真实世界场景。
摘要由CSDN通过智能技术生成

出处:ICLR 2017

贡献
  • 为了验证end2end的任务型对话系统的效果,论文构建了7个在线订餐的数据集,包括:

    • 5个模拟的数据集
    • 1个DSTC2(Dialog State Tracking Challenge)改造过来的真实数据集
    • 1个真实用户和真人操作员之间的真实数据集
  • 作者在这些数据集上进行了多种模型的实验,包括基于规则的系统、基于经典信息抽取的方法、有监督embeddings方法、end2end的记忆网络MemN2N,并得出记忆网络效果最好的结论。

数据集

地址:http://fb.ai/babi

  • 5个模拟数据集
    数据集格式如下:
    每个任务包括训练集+验证集+测试集三个语料,每个语料有1000个对话。对话之间用空行隔开,同一个对话用id标识每一轮,每一轮一行,包括用户说话和bot说话,用\t隔开。句子中以<SILENCE>开头的是需要预测的句子。此外。每个任务还包括一个有OOV词的测试集,即存在不在训练集出现过的实体名,但是在kb(知识库)出现过。5个任务共用一个kb,即文件dialog-babi-kb-all.txt,里面记录了每个餐厅的位置、电话、档次等信息;此外还共用一个候选句子库,即文件dialog-babi-candidates.txt,该文件包括5个task里面所有训练集+验证集+2个测试集里面bot说的话。因此任务是从候选句子中选出<SILENCE>最可能的句子,而不是逐词生成<SIL
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值