一文读懂few-shot learning

最新推荐文章于 2024-04-16 16:03:11 发布

Ctrl_Cver

最新推荐文章于 2024-04-16 16:03:11 发布

阅读量1.6k

点赞数 4

分类专栏：深度学习文章标签：神经网络深度学习

本文链接：https://blog.csdn.net/qq_33596242/article/details/113121687

版权

深度学习专栏收录该内容

26 篇文章 0 订阅

订阅专栏

在这里插入图片描述
前提: 有一点代码基础，理解数据的维度。

目的: 用少量的样本训练模型，使模型具备分类能力。

数据集CUB: 200类，100 base class(训练集)，50 valid class，50 novel class(测试集)。

训练方法：
1：直接用base class训练一个200类别的CNN分类器。
2：meta-learning method（训练和测试保持一致），以5-way 5-shot（从base class中随机取5个类别，每个类别随机取5张图，这里25张图片为support set）为例，假设query set 有16张图片（5个类别剩余的其他图片）。输入网络的数据为(5-way,5-shot+16,3,h,w)=(5,21,3,h,w)，然后放入CNN中得到support set的特征(5,5,1600)和query set的特征(5,16,1600)，接下来平均support set中每个类每张图片的特征mean((5,5,1600)，dim=1)=(5,1600)，reshape query set=（80,1600)，最后计算两个set的距离得到(80,5)维向量，这可以表示query set中每张图片与support set中哪张图片比较相似，然后用一下交叉熵损失即可。【meta-training task】

note：每次随机取的五个类，重新定义标签为[0,1,2,3,4]，所以才可以对(80,5)使用交叉熵损失。base class中的support set和query set都拿来训练，只是最后计算损失时，分开计算它们之间的距离。

验证：
简单的同训练方法1，直接把所有测试集valid class放进网络查看分类精度。

测试：
训练完网络后，得到特征提取器（backbone)，固定其权重，把novel class放入其中得到每张图片的特征，假设每张图片1600维。【接下来，从novel class中随机取5类，每类里面取5张图片5-way 5-shot(support set)和16张图片(query set)，得到(5x(5+16),1600)=(5x5,1600)+(5x16,1600)，把support set(25,1600)放入一层的分类器中分类，训练100个epoch，最后把query set(80,1600)放入测试得到结果。】【称为一个episode，要测试几百个episode取平均】【meta-test task】。这里你也许有疑问，这样训练(fine-tune)不是测试集也进行拟合了吗，其实每个meta-test task中的那层分类器都是重新定义的。

点个赞哦，亲(づ￣3￣)づ╭❤～

Ctrl_Cver

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
一文读懂few-shot learning

**目的:**用少量的样本训练模型，使模型具备分类能力。（注意：以下数字全为假设）含义: few-shot的训练集包含100个类别，每个类别有10个样本，在训练阶段，会在训练集中随机抽取10个类别，每个类别1个样本（一共101=10个数据构成一个meta-task），作为support set，再从这10个类中剩余的90个数据中抽取一批样本作为模型的预测对象，作为query set。即要求以101=10个训练数据学会如何区分这10个类别，这样的任务称为10-way，1-shot问题。测试阶段同训练阶段.
复制链接

扫一扫