北大学姐博士阶段收官之作ACL2020-低资源场景下的对话系统任务模型定制

AITIME论道

于 2020-08-11 18:21:00 发布

阅读量923

点赞数

文章标签：算法大数据机器学习人工智能深度学习

本文链接：https://blog.csdn.net/AITIME_HY/article/details/107948309

版权

AI TIME欢迎每一位AI爱好者的加入！

用最少的语料训练生成模型是构建开放域对话系统的关键挑战之一。现有的方法倾向于使用元学习框架，首先预训练所有非目标任务的参数，然后在目标任务上进行微调。然而，微调的方法仅仅将不同任务从参数角度区分开来，却忽略了模型的结构，容易产生相似的对话模型。

在第五期AI Time PhD对话系统专题分享的直播间，我们邀请到北京大学信息科学技术学院2020级博士毕业生宋伊萍，为大家介绍她在ACL2020中发表的最新研究成果。

讲者及其团队提出了CMAML算法，可以为每一个对话任务定制一个独特的模型。在CMAML中，每个对话模型由一个共享模块、一个门控模块和一个私有模块组成。讲者提出的CMAML在任务一致性、回复质量和多样性方面都优于所有基线模型，且在低资源文本生成任务上具有较强的通用性。

宋伊萍，北京大学信息科学技术学院2020级博士毕业生，导师为张铭教授。主要研究方向为自然语言处理和对话系统，已在相关领域的国际顶级会议如ACL, AAAI, IJCAI等发表多篇论文。

一、元学习是什么呢？

元学习Meta Learning，含义为学会学习，即learn to learn，就是带着这种对人类这种“学习能力”的期望诞生的。Meta Learning希望使得模型获取一种“学会学习”的能力，使其可以在获取已有“知识”的基础上快速学习新的任务，如：

????让一个长颈鹿图片的分类器，迅速具有分类其他物体的能力。

对比理解machine learning和meta learning的两个概念。

二、经典的元学习方法——MAML

1、

元学习使用的两种场景

1）元学习的方法与模型无关，适用性强。

任何的一个监督的学习，比如分类回归、强化学习等，凡是用梯度下降来更新参数的，都可以使用这种方法。

2）需要的场景数据少。

在机器学习中，训练单位是一条数据，通过数据来对模型进行优化；数据可以分为训练集、测试集和验证集。

在元学习中，训练单位分层级，第一层训练单位是任务。元学习中要准备许多任务来进行学习，第二层训练单位才是每个任务对应的数据。

2、

元学习的具体算法

1）方法：利用一系列分类器task的训练数据作为训练样本，找到一个最好的全局参数θ，将其迁移到新的任务上，迅速的去学习到一个对新的场景的分类器。

2）算法：以分类任务和回归任务为例：

a)准备N个训练任务(Train Task)、每个训练任务对应的Support Set和Query Set。再准备几个测试任务，测试任务用于评估meta learning 学习到的参数的效果。训练任务和测试任务均从Omniglot中采样产生。
b)初始化一个meta网络的参数为θ。
c)开始执行迭代“预训练” 。
d)通过上一步得到meta网络的参数,该参数可以在测试任务中,使用测试任务的SupportSet对met网络的参数进行finetuing。
e)最终使用测试任务的Query Set评估meta learning的效果。