元学习-李宏毅老师课程笔记

最新推荐文章于 2022-11-30 21:33:43 发布

Mr_tianyanxiaobai

最新推荐文章于 2022-11-30 21:33:43 发布

阅读量572

点赞数

分类专栏：深度学习-花花书-笔记机器学习人工智能文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Mr_tianyanxiaobai/article/details/108882465

版权

元学习的基础概念

meta learning = learn to learn
元学习其实就是阐释训练模型的一种算法。

meta learning 的步骤

定义一组learning algorithm

定义红色方块的具体算法进而形成一组learning algorithm
评价 learning algorithm 的好坏：

L 越小，则 function algorithm 的 representation 越好
meta-learning 和 ml 的区别是meta-learning 需要多个独立的任务

寻找模型初始化模块的 function algorithm

MAML(model-agnostic meta-learning)

在这里插入图片描述
MAML：主要是寻找一组较为合适的初始参数 $\phi$ ，这里使用的损失函数就是所有任务的损失之和，表示外循环的损失函数。

Model Pre-training

model pre-training 和 MAML 的区别：损失是不同的。

在这里插入图片描述
从上图可以看出，model pre-training 的参数主要是 $\phi$ 。而 meta-learning 的损失，是通过内循环的训练出来结果的损失。简单的说，我们并不在意初始模型参数 $\phi$ 对某个任务的 representation，在意的是对总的损失。这就是 MAML 的核心思想，如下：
在这里插入图片描述
点 A 的状态或许对于 task1 和 task2 都不是最后的模型初始点，但是以 $\phi$ 为初始状态，我们可以用很小的代价到达 task1 和 task2 的最佳模型。

$\theta$ 的 update

这里的 $\theta$ 只更新一次，也就是说每个 task 只在初始化为 $\phi$ 情况下更新一次：
在这里插入图片描述
只做一次 update 的优点：

由于是 few-shot ，因为一次update 可以防止过拟合
Fast
在训练时，期望得到的模型能够在一步 update 后获得较好的representation。

公式的推导

在这里插入图片描述
从上面推导可以看出，我们在模型训练时是求取二阶微分的，但是其实二阶微分的求取是很复杂的。在MAML的实际实验中，作者将二阶微分进行了省略与近似（也就是原论文中的一阶微分近似）。
比如：
在这里插入图片描述
即原来的式子可以化为：

MAML-Real Implementation

最低0.47元/天解锁文章

Mr_tianyanxiaobai

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
元学习-李宏毅老师课程笔记

训练数据：38400 张测试数据：12000 张检验数据：9600 张
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。