出处:ICLR 2017
贡献
-
为了验证end2end的任务型对话系统的效果,论文构建了7个在线订餐的数据集,包括:
- 5个模拟的数据集
- 1个DSTC2(Dialog State Tracking Challenge)改造过来的真实数据集
- 1个真实用户和真人操作员之间的真实数据集
-
作者在这些数据集上进行了多种模型的实验,包括基于规则的系统、基于经典信息抽取的方法、有监督embeddings方法、end2end的记忆网络MemN2N,并得出记忆网络效果最好的结论。
数据集
地址:http://fb.ai/babi
- 5个模拟数据集
数据集格式如下:
每个任务包括训练集+验证集+测试集三个语料,每个语料有1000个对话。对话之间用空行隔开,同一个对话用id标识每一轮,每一轮一行,包括用户说话和bot说话,用\t隔开。句子中以<SILENCE>开头的是需要预测的句子。此外。每个任务还包括一个有OOV词的测试集,即存在不在训练集出现过的实体名,但是在kb(知识库)出现过。5个任务共用一个kb,即文件dialog-babi-kb-all.txt,里面记录了每个餐厅的位置、电话、档次等信息;此外还共用一个候选句子库,即文件dialog-babi-candidates.txt,该文件包括5个task里面所有训练集+验证集+2个测试集里面bot说的话。因此任务是从候选句子中选出<SILENCE>最可能的句子,而不是逐词生成<SIL