[PMLR 2017] Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

最新推荐文章于 2025-02-25 14:55:29 发布

一亩高粱

最新推荐文章于 2025-02-25 14:55:29 发布

阅读量876

点赞数

分类专栏：小样本学习文章标签： few shot learning 小样本学习 fsl

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cp_oldy/article/details/103222206

版权

小样本学习专栏收录该内容

14 篇文章

订阅专栏

本文深入探讨MAML元学习算法，旨在寻找一个优秀的网络初始化参数，使模型在新任务上快速泛化。通过循环迭代，采样任务并计算梯度，MAML能够更新base-learner与meta-learner参数，实现高效学习。然而，MAML受限于所有任务需使用相同网络结构，且倾向于采用浅层网络避免过拟合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MAML

0. 摘要
1. 动机
2. 方法
3. 实验
4. 分析
5. 讨论
6. 参考

0. 摘要

MAML学习一个好的网络初始化参数，期望在新任务上可以快速泛化。

1. 动机

学习一个网络初始化参数，能够快速泛化到新任务上。
在这里插入图片描述

2. 方法

在这里插入图片描述
$\alpha$ 是base-learner的学习率； $\beta$ 是meta-learner的学习率。

随机初始化元学习参数 $\theta$
while循环迭代
采样一个批次的任务 $\mathcal T_i$
对于每一个采样任务
计算K个训练样本下，任务 $\mathcal T_i$ 的梯度
用 $\theta$ 初始化网络参数，然后用梯度下降法更新base-learner参数为 $\theta'$
对于每一个采样任务
计算所有任务测试集上的损失，根据梯度下降更新meta-learner的参数 $\theta$ 。
结束循环

在这里插入图片描述

3. 实验

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

4. 分析

MAML只是学习一个初始化参数，限制是所有任务使用同样的网络结构和更新规则。
MAML用的网络是浅层网络，为了不在小样本上过拟合。

5. 讨论

pre-train为什么只走一步？pre-train也走两步，不就是reptile？
tianyu的解释：pre-train只能走一步吧他只是在一个大的数据集上预训练本质上就是个train 怎么走两步
如何理解MAML、Reptile、Pre-train走一步，走两步？

6. 参考

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。