元学习（Meta Learning）中的数学推导（梯度下降公式推导）

zeronose

于 2020-10-14 15:24:57 发布

阅读量1.6k

点赞数 1

分类专栏：论文阅读文章标签：深度学习人工智能 meta-learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zeronose/article/details/109066963

版权

论文阅读专栏收录该内容

12 篇文章

订阅专栏

本文详细解析了李宏毅教授关于元学习的视频内容，重点介绍了MAML（Model-Agnostic Meta-Learning）的参数更新公式。首先，阐述了MAML寻找最优初始参数的目标，接着解释了损失函数的构成，并讨论了每个任务参数的一次性更新。在推导过程中，将梯度表示为对所有任务损失函数的梯度期望，探讨了其数学表达式，深入理解元学习的核心机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文中元学习（Meta Learning）是学习了李宏毅教授的视频https://www.bilibili.com/video/BV1w4411872t?from=search&seid=1873861796790113250（关于文中的公式推导，实际上是MAML的公式推导）

参数更新公式：

其中第一个公式为MAML中初始参数的更新，也就是MAML想要做的，找到一个较好的初始参数。
第二个公式为MAML的损失函数，是所有task损失函数的和。
第三个公式为每一个task的初始参数更新，MAML中限制只更新一次。
提出问题：
根据参数更新的第一，二两个公式，可以将公式一中的梯度写成如下：

在这里插入图片描述
此时，有一个问题，梯度是

那么

公式推导

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

所以

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。