元学习(Meta Learning)中的数学推导(梯度下降公式推导)

文中元学习(Meta Learning)是学习了李宏毅教授的视频https://www.bilibili.com/video/BV1w4411872t?from=search&seid=1873861796790113250(关于文中的公式推导,实际上是MAML的公式推导)

  1. 参数更新公式:
    在这里插入图片描述
    其中第一个公式为MAML中初始参数的更新,也就是MAML想要做的,找到一个较好的初始参数。
    第二个公式为MAML的损失函数,是所有task损失函数的和。
    第三个公式为每一个task的初始参数更新,MAML中限制只更新一次。

  2. 提出问题:
    根据参数更新的第一,二两个公式,可以将公式一中的梯度写成如下:

在这里插入图片描述
此时,有一个问题,梯度是
在这里插入图片描述
那么在这里插入图片描述

  1. 公式推导

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
所以在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值