AI TIME欢迎每一位AI爱好者的加入!
近年来,任务导向对话受到了越来越多的关注,涌现出许多数据集和基于神经网络的模型。第二期AI Time PhD对话系统专题分享的直播间,我们邀请到清华大学计算机系2018级博士生、交互式人工智能组成员朱祺,为大家介绍最新研究成果。
为了推动多领域对话的研究和填补中文数据的空白,朱祺及其团队提出了CrossWOZ,第一个中文大规模任务导向对话数据集,文章发表于TACL 2020。此外,为了对多种形式构建的对话系统进行统一端到端评测,开发了ConvLab-2对话平台,支持用最新的模型快速搭建、评估、诊断对话系统,被ACL 2020 demo track接收。特别提醒:ConvLab-2和CrossWOZ将被用于今年DSTC9比赛呢!小伙伴们是不是都蠢蠢欲动了呢?
一、回顾任务导向对话系统
一个典型的基于管道方法的任务导向对话系统由四个模块组成:
-自然语言理解(NLU):对来自用户的自然语言描述进行识别,解析成结构化的信息;
-对话状态追踪(DST):更新当前对话的状态,和背后数据库或知识库进行交互,查询满足用户条件的实体;
-对话策略(DP):根据当前对话状态,选择下一步系统需要回复的结构化信息
-自然语言生成(NLG):将接收的结构化信息转换成自然语言,并反馈给用户。
图:典型管道方法任务导向型对话系统框架
现实生活的对话不局限于单个领域,人们很容易在不同场景之间来回切换,同时仍保持上下文的连贯,比如下图从景点过渡到酒店场景,酒店的约束条件由景点决定。用户根据系统推荐的内容选择结果,根据结果修改其他领域的约束。因此,本文提出了CrossWOZ,第一个大规模中文多领域任务导向对话数据集。
你好哇,我要去评分4.5以上的景点。
天安门城楼,簋街小吃和北京欢乐谷都是很不错的地方呢。
我喜欢北京欢乐谷,你知道这个景点周边的酒店都是什么吗?
那可多了,有A酒店, B酒店, C酒店。
请输入文字