10.29读书笔记《python元学习:通用人工智能的实现》第7章Meta-SGD和Reptile

第7章Meta-SGD和Reptile

  1. Meta-SGD 随机梯度下降
    在MAML基础上,还学习:学习率和适应方向。
    在这里插入图片描述
    此处的α是向量。
    使用与θ形状相同的α作为初始化学习率,更新方向是自适应项方向,不再是梯度方向。外循环中,同时更新θ和α:
    在这里插入图片描述
    在tensorflow中构建
    核心代码在于,比MAML多了α的更新:
    self.theta = self.theta-self.betameta_gradient/self.num_tasks
    self.alpha = self.alpha-self.beta
    meta_gradient/self.num_tasks
    但我有一个问题,这不是θ和α更新的值都一模一样?????α这么更新到底是啥意思。。原理是什么。。不明白了

  2. Reptile
    对每个抽样任务进行迭代次数更少的随机梯度下降(SGD),然后通过使最优参和原始参的距离最小来更新参数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值