Lecture 15：元学习Meta Learning2

最新推荐文章于 2024-06-10 00:35:53 发布

zzz_qing

最新推荐文章于 2024-06-10 00:35:53 发布

阅读量567

点赞数

文章标签：学习深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzz_qing/article/details/130633403

版权

目录

Meta Learning – MAML

Meta Learning – Gradient Descent as LSTM

Meta Learning – Metric-based

Meta Learning - Train+Test as RNN

Meta Learning – MAML

Meta Learning：让机器自动找出learning algorithm

Meta Learning的三个步骤（前面笔记有写，这里简单复习一下）：

step 1: Define a set of learning algorithm

step 2: Defining the goodness of a function F

Meta Learning常常跟few-shot learning一起使用

step 3: Find the best function F*

下面介绍Meta Learning的两个technique：MAML、Reptile

MAML

评价Φ的好坏：如下图，Φ本身拿去做task1和task2没有很强，但是Φ拿去做训练以后（用task1和task2的data做训练后）变得很强，那它就是一个好的Φ

MAML v.s. Model Pre-training

MAML在实作的时候，training algorithm通常只做一次update，理由如下：

Fast ... Fast ... Fast ...
Good to truly train a model with one step.
When using the algorithm, still update many times.
Few-shot learning has limited data.

MAML - Real lmplementation: MAML走两步gradient，用第二步gradient去update参数Φ

对比下pre-training：往当前Φ在training task上算出来的gradient方向移动

把MAML实作在translation的任务上，结果如下图。MAML比pre-training效果好，尤其是在训练资料量少的时候。

Reptile

Reptile和MAML、pre-train的不同：

下图是Reptile、MAML、pre-train实作在Omniglot上的结果，可以看到meta learning的方法效果明显好于pre-train的方法：

Meta Learning – Gradient Descent as LSTM

Review Recurrent Neural Network:

Review LSTM:

LSTM和gradient descent的式子有相似之处：

LSTM for Gradient Descent:

LSTM memory cell中的值，就是network的参数

LSTM for Gradient Descent在实作上，因为LSTM的memory cell不可能开的太大（1024个memory cell就算比较多的了），而network的参数通常有几万到几十万个，所以在实作上LSTM只开一个cell，所有的network参数都通过相同的LSTM训练出来：

Meta Learning – Metric-based

Metric-based是一个比较crazy的idea，它希望输入training data和testing data，能够直接输出predicted label of testing data：

后面都以Face Verification这个task为例，它是一个few-shot learning的task：

Face Verification可以当做一个meta learning的任务做：

对于上面图片中的network，我们要训练这个network能够同时做训练和测试。实际上这个network的架构最常见的设计叫做Siamese Network（可以理解为孪生网络）：

Siamese Network - Intuitive Explanation（当做一个binary classification的problem去理解）

上面都是做的Verification的任务，即可以当成binary classification的任务，下面介绍如何做identification的任务，即N-way Few/One-shot Learning的任务。

N-way Few/One-shot Learning任务举例：

这种任务的network架构如何设计？下面给出三个文献上的做法：

① Prototypical Network

② Matching Network

这个network和Prototypical Network很类似，它们最大的区别在于Prototypical Network把training data的每一张图片都分开处理，Matching Network用一个bidirectional LSTM接收所有的training data。

③ Relation Network

在few-shot learning中常常遇到的问题是训练资料很少，所以我们可以让机器去generate训练资料。generator是和network一起被learn出来的。

Meta Learning - Train+Test as RNN

在上面使用过的Metric-based approach的方法，使用的是专门设计过的network architecture。Can we use general network architecture？

用一般的LSTM train不起来，修改LSTM架构（比较知名的有MANN、SNAIL）后可以train起来：

文献上结果表明SNAIL效果比较好：

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
Lecture 15：元学习Meta Learning2

上面都是做的Verification的任务，即可以当成binary classification的任务，下面介绍如何做identification的任务，即N-way Few/One-shot Learning的任务。在上面使用过的Metric-based approach的方法，使用的是专门设计过的network architecture。评价Φ的好坏：如下图，Φ本身拿去做task1和task2没有很强，但是Φ拿去做训练以后（用task1和task2的data做训练后）变得很强，那它就是一个好的Φ。
复制链接

扫一扫

zzz_qing CSDN认证博客专家 CSDN认证企业博客

码龄5年

44: 原创

118万+: 周排名

187万+: 总排名

8983: 访问

: 等级

448: 积分

9: 粉丝

2: 获赞

7: 评论

12: 收藏

私信

关注

热门文章

分类专栏

论文精读 2篇

最新评论

Overcoming catastrophic forgetting in neural networks
xuebing55555: 请问有完整实现代码吗？
Lecture 15：元学习Meta Learning2
CSDN-Ada助手: 非常棒的博客！学习元学习是非常有趣和有用的！我们希望看到更多关于此主题的内容。我们建议您写一篇有关如何使用元学习来优化深度学习模型的博客。谢谢你的分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
Lecture 15：元学习Meta Learning2
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615663682?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utm_source=blogger_star_comment。
The first GAN——Generative Adversarial Nets
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614789723。
[机器学习]Lecture 1：Regression，Pokemon classification，Logistic Regression
CSDN-Ada助手: 非常感谢您分享这篇博客。恭喜您能够坚持创作，继续保持哦！同时，我希望您能够在未来的博客中，更深入地探讨机器学习的其他方面，例如深度学习和神经网络等等。期待您的下一篇作品，谢谢！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。