Meta-Baseline Exploring Simple Meta-Learning for Few-Shot Learning

Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot Learning

介绍

现在大多数方法使用元学习meta-learning解决小样本任务,即将整个训练集划分为三种类别不相交的训练、验证和测试集。网络训练时以task为单位,每个task视为一个N-way K-shot任务,由Support Set包括 N × K N\times K N×K样本和Query Set N × Q N\times Q N×Q样本组成。根据支持集样本将 N × Q N\times Q N×Q样本分类到N个类别中。描述小样本输入可参考:A task takes the form of N-way K-shot。

灵感

虽然元学习方法可以使训练集和测试集形式保持一致,但是直接在训练集上当做一个分类任务学习分类模型,得到的分类效果比基于task的元学习方法效果更好。为什么元学习得到的特征更差呢?可能是优化困难,也可能是过拟合,但是这些原因至今未被探索。基于此,作者通过解耦差异来套索两种方法的边缘,分别构建Classifier-Baseline和Meta-Baseline。


[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Fyr2n4Kd-1638771042689)(file:///C:\Users\lsw\AppData\Roaming\Tencent\Users\1492457122\QQ\WinTemp\RichOle\FX]{($K(0{)]K1_CFS_ZP0.png)

Classifier-Baseline即传统的分类方式,训练一个网络,网络输入每个类别的概率分布。而Meta-Baseline训练一个网络,拿掉最后一层全连接层,对每个类别特征求平均得到类平均特征,计算query样本与每个类平均特征的余弦相似度,将相似度最大的类平均特征的类别分配给query样本。
在这里插入图片描述

作者提出了一个怎样的baseline呢,其实就是定义一个网络,先让这个网络在 D b a s e D_{base} Dbase上预训练一遍。然后再把预训练的网络拿掉最后的全连接层,再以meta-learning的方式再训练一遍。然后在求余弦相似度的时候加了一个参数而已。

相似度的时候加了一个参数而已。

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

秃头嘤嘤魔

感谢厚爱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值