元学习论文OPTIMIZATION AS A MODEL FOR FEW-SHOT LEARNING的简单理解

 

我们常用的基于梯度优化的深层网络往往需要大量的数据和迭代步骤。
我们面对的数据场景是有一系列小的数据集而不是一个大的数据集,每一个类有很少的标记数据,这种情况和人类的学习很像,通过一个给定的数据,就能总结出对事物全面的认识,其中主要有两个原因导致了基于梯度的优化算法在小样本下表现不好。元学习被认为是实现人类水平的智能的一个关键点,元学习在两个层次间学习,(1)在每项任务中学习,(2)同时积累任务之间相似性和差异的知识。
受参数梯度更新的启发,提出了基于lstm的元学习模型,因为元学习的更新和lstm细胞状态的更新相似,因此我们训练一个基于lstm的元学习器来学习训练网络过程中的更新规则,我们把lstm中单元的状态看作元分类器的参数,将元学习器的更新规则和LSTM的细胞状态更新相匹配。


元学习优化器能够在给定一系列分类器在训练集的梯度和损失下,为分类器生成一系列更新,从而使分类器达到较好的表现。每一步迭代t,基于lstm的元学习器都接受到分类器传来的梯度,损失等信息,元学习器基于此计算学习率和忘记门的值,并返回给分类器要更新的参数的值,每迭代T步,分类器的损失在测试集上计算出来返回给元学习器,用来训练元学习器,更新元学习器的参数。

带注释论文的下载链接如下:
https://download.csdn.net/download/qq_34562093/10975718

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值