MAML:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

最新推荐文章于 2024-06-10 20:25:31 发布

liuglen

最新推荐文章于 2024-06-10 20:25:31 发布

阅读量5.4k

点赞数 2

分类专栏： meta learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liuglen/article/details/84933093

版权

元学习的目标是在各种学习任务上训练一个可以仅仅使用少量训练样本就可以解决新任务的模型，在本文中，模型的参数训练很明确，所以从新任务的少量样本做几步梯度下降就可以在新任务上得到好的泛化性。同时，由于模型可应用于一系列使用梯度下降训练的模型，包括分类，回归，强化学习等等，所以也叫作模型无关的模型。
本文的关键思想在于训练模型的初始参数，使得模型的参数在某个新任务上仅适用少量样本经过一步或者几步梯度下降更新后就可以早新任务上有很好的表现。从特征学习的角度来看，这是一个建立适应多种任务的内部特征表达的过程，使得其可以更容易，更快速的fine-tune；从动态系统的角度来看，学习过程可以被看做是最大化loss function对于和新任务有关的参数的敏感度，当敏感度高时，参数的小的局部改变可以使loss得到巨大的提高。

模型

任务设定

考虑一个模型，用 $\mathcal{f}$ 表示，将观察值x映射到输出a上。在元学习过程中，模型被训练以适应于大量或无限的任务。任务可以形式化地定义如下，
$\mathcal{T} = \{\mathcal{L}(x_1,a_1,...,x_H,a_h),q(x_1),q(x_{t+1}|x_t,a_t),H\}$
由损失函数 $\mathcal{L}$ ，基于初始观察值的分布 $q(x_1)$

最低0.47元/天解锁文章

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
MAML:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

元学习的目标是在各种学习任务上训练一个可以仅仅使用少量训练样本就可以解决新任务的模型，在本文中，模型的参数训练很明确，所以从新任务的少量样本做几步梯度下降就可以在新任务上得到好的泛化性。同时，由于模型可应用于一系列使用梯度下降训练的模型，包括分类，回归，强化学习等等，所以也叫作模型无关的模型。本文的关键思想在于训练模型的初始参数，使得模型的参数在某个新任务上仅适用少量样本经过一步或者几步梯度下降...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。