研究任务型对话系统,首先得从数据集采集说起,学术界需要公开的数据集来证明模型的效果,工业界更需要以数据集为基础来构建更鲁棒的对话系统,那么业界成熟的对话系统数据集有哪些呢,对于多轮,如何更科学的采集数据减少错误呢,本文调研了一些近来一些方案供参考。
WoZ&MultiWOZ
DSTC
中文多轮对话数据集
千言
CrossWoz
医患对话数据集
多领域知识驱动的中文多轮对话数据集
参考资料:
【多轮对话】任务型多轮对话数据集和采集方法
研究任务型对话系统,首先得从数据集采集说起,学术界需要公开的数据集来证明模型的效果,工业界更需要以数据集为基础来构建更鲁棒的对话系统,那么业界成熟的对话系统数据集有哪些呢,对于多轮,如何更科学的采集数据减少错误呢,本文调研了一些近来一些方案供参考。
参考资料:
【多轮对话】任务型多轮对话数据集和采集方法