AI TIME欢迎每一位AI爱好者的加入!
对话系统的可控性对于实用系统来说是一个至关重要的问题。第三期AI Time PhD对话系统专题分享的直播间,我们邀请到清华大学计算机系博士后、交互式人工智能组成员郑银河,为大家介绍最新研究成果。
本次分享中,郑银河及其团队将在自然语言生成(NLG)和自然语言理解(NLU)两个方面讨论了对话系统的可控性:首先介绍如何在生成自然语言回复的过程中融入特定的个性化信息,然后讨论如何在自然语言理解模块中有效地识别用户的异常输入。
郑银河,清华大学计算机系与北京三星研究院联合培养博士后,交互式人工智能组(CoAI)成员,博士后合作导师是黄民烈副教授。主要研究方向为对话系统中的自然语言生成与自然语言理解。曾在AAAI, ENMLP, IEEE TASLP等顶级会议与期刊上发表数篇论文。
一、对话系统中的NLU和NLG
自然语言理解(NLU):对来自用户的自然语言描述进行识别,解析成结构化的信息;
自然语言生成(NLG):将结构化的语义数据转换成人可以理解的语言格式,如对话回复、文章、报告等。
NLP = NLU + NLG
NLU 负责理解内容,NLG 负责生成内容。
在本次分享中所提到的NLU的可控性和NLG的可控性包括以下部分:
NLU的可控性:准确地剔除输入中的无效指令和异常指令;
NLG的可控性:生成带有特定特征和内容的对话回复。
二、自然语言生成-个性化回复生成
a)
数据集
传统:PersonaChat 数据集 (“Personalizing Dialogue Agents I have a dog, do you have pets too”)