Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks(MAML)简析

薛定谔的哆啦B梦

已于 2023-01-02 20:40:38 修改

阅读量898

点赞数 3

分类专栏：元学习文章标签：计算机视觉深度学习神经网络 Powered by 金山文档

于 2023-01-02 20:36:48 首次发布

本文链接：https://blog.csdn.net/qq_61462487/article/details/128523881

版权

元学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在看MAML这篇论文的时候，因为是初学者，很多都不懂，网上查了许多资料也没看明白，最后来来回回找了很多资料结合原文才看懂一些，在这简单分享一下。

什么是元学习？

元学习(meta-learning)已经有很多定义了，最常见的就是学习学习，即learning to learn。这里从其他方向说一个可能不是很好但是有助于理解的定义，就是把常规的训练模型的某一个过程替换成一个可学习的模块。比如：

MAML就是把模型初始化的过程拿出来换成了一个可以学习的过程。

MAML原文

MetaReg是把正则项换成了一个可以学习的部分。

MetaReg原文

还有将梯度下降过程替代为单独的神经网络模型的。

Optimization as a Model for Few Shot Learning 原文

要解决什么问题？

MAML提出来时是为了解决少样本学习问题，即few-shot learning。后续MLDG将该方法拓展到域泛化(Domain Generalization)的问题，其他方法也有将MAML类似的学习过程用于解决其他问题，不过后续我就不是很了解了。

那什么是少样本学习呢？顾名思义，就是样本比较少的学习。。。。。比如对小孩子来说，给他看几张长颈鹿的图片他就能认识长颈鹿，但是对于机器学习来说，需要大量的数据进行训练，如果学习样本比较少的话，模型就很难work起来，少样本学习要解决的就是这个问题。

概念定义

MAML将原来普通的训练集和测试集更改为了训练任务和测试任务，每种任务都有相应的训练集和测试集，为了便于区分，也叫做支持集support set和查询集query set。其中训练任务的支持集和查询集用于训练，测试任务的支持集用于微调，为了区别于预训练，也可以叫快速学习，最后测试任务的查询集是模型要表现良好的目标，这也是MAML的一个重点，即不关心在训练任务上的效果，只希望在测试任务的查询集上有较好的表现。