论文阅读：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

BlueagleAI

已于 2023-08-26 11:42:46 修改

阅读量1.1k

点赞数

文章标签：论文阅读

于 2023-08-26 11:30:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/blueag1e/article/details/132508526

版权

前言

要弄清MAML怎么做，为什么这么做，就要看懂这两张图。
先说MAML**在做什么？**它是打着Mate-Learing的旗号干的是few-shot multi-task Learning的事情。具体而言就是想训练一个模型能够使用很少的新样本，快速适应新的任务。

定义问题

我们定义一个模型 $f$ , 输入 $x$ 输出 $a$ 。
-定义每一个Task - $T$ 包含一个损失函数 $L$ , 一个原始观察 $q(x_1)$ , 一个状态转移分布 $q(x_1 | x_t,a_t)$ 以及集长度 $H$ 。在监督任务中H=1(也就是说当前的a只和当前的x有关)。

元学习方法介绍

元学习，被称为“Learn to Learn”的方法。元学习希望获取一个网络（结构+参数），满足一定的预设要求。
在我们的元学习场景中，我们考虑了一个跨任务的分布 $p (T)$ ，我们希望我们的模型能够适应这个分布。在 K -shot学习的设置中，模型被训练来学习一个新的任务 $T_i$ ，这个任务是从 $p (T)$ 中抽取的，只使用了从 $q_i$ 抽取的 K 个样本，并且由 $T_i$ 生成的反馈 $L_{T_i}$ 。在元训练期间，从 $p (T)$ 中抽取一个任务 $T_i$ ，模型会用从 $T_i$ 中抽取的 K 个样本和相应的损失 $L_{T_i}$ 的反馈进行训练，然后在来自 $T_i$ 的新样本上进行测试。然后，通过考虑模型在新数据上的测试误差更新参数，来改进模型 $f$ 。实际上，对抽样的任务 $T_i$ 进行的测试误差充当了元学习过程的训练错误。在元训练结束时，从 $p (T)$ 中抽取新任务，并通过模型从 K 个样本中学习后的表现来衡量元能力。通常，在元训练期间保留用于元测试的任务。

A Model-Agnostic Meta-Learning Algorithm

给定一个初始的神经网络结构及参数，使用针对同一领域的多个任务集作为样本，对每个任务集分配这样一个网络，不同的任务集对各自的网络做一次loss计算和梯度更新，然后对所有更新之后的神经网络再计算一次loss，将这些loss综合考虑起来作为一个新的loss，来更新那个最开始的神经网络，再将获得到的网络作为新的初始神经网络，迭代这个过程。—引用自
这种方法背后的直觉是，一些内部表示比其他表示更可转移。The intuition behind this approach is that some internal representations are more transferrable than others.
实际上，我们的目标是找到对任务变化最敏感的模型参数，这样当改变梯度的方向，损失的小改变参数将产生大改进，如下图。
我们定义一个模型表示为 $f_{\theta}$ 。当适应新的任务 $T_i$ 时，模型参数从 $\theta$ 变为 $\theta'_i$ .在我们的方法中，我们更新参数使用一个或多个任务T $T_i$ 梯度向量.
当使用一个梯度进行更新：
而元-目标是：

-整个算法如下：

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
论文阅读：Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks

我们定义一个模型fff, 输入xxx输出aaa。-定义每一个Task -TTT包含一个损失函数LLL, 一个原始观察qx1q(x_1)qx1, 一个状态转移分布qx1∣xtatqx1∣xtat以及集长度HHH。在监督任务中H=1(也就是说当前的a只和当前的x有关)。在我们的元学习场景中，我们考虑了一个跨任务的分布pTp(T)pT，我们希望我们的模型能够适应这个分布。
复制链接

扫一扫

BlueagleAI CSDN认证博客专家 CSDN认证企业博客

码龄6年

76: 原创

10万+: 周排名

6万+: 总排名

7万+: 访问

: 等级

1285: 积分

145: 粉丝

146: 获赞

27: 评论

255: 收藏

私信

关注

热门文章

分类专栏

最新评论

论文阅读：AdaBins: Depth Estimation using Adaptive Bins
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读: Visual Attention Network
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：How Do Neural Networks See Depth in Single Images?
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读: Semantics-guided Triplet Loss
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：AugGAN: Cross Domain Adaptation with GAN-based Data Augmentation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

BlueagleAI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。