前言
本入门博客面向零基础的小样本图像菜狗硕士,或者其他想学习小样本图像分类的业余人士。本篇简单介绍一下小样本的图像分类的前置基础知识和几个小样本图像分类任务的基本概念,以及我对小样本图像领域发论文,毕业情况的看法。
前置知识
- 卷积神经网络
- cnn实现图像分类
卷积神经网络
卷积神经网络的教程网络上非常多,我这里不多赘述。我推荐一个基础网络的b站up主,叫做霹雳吧啦Wz(点击链接),他的视频讲解非常细致,并且他不是只讲论文,他会手把手带你入门pytorch模型搭建,这一点难能可贵,解决了大家对于模型代码的理解。我当时就是看了他的视频,才理解LeNet,ResNet等模型的代码。
大家这里不用急,只需看完他对于卷积网络CNN的讲解,并能够理解代码结构即可,后面的我们用到再学都可以。
CNN实现图像分类
同上,推荐霹雳吧啦Wz(点击链接) 这里讲解了一个基础图像分类的代码以及理论逻辑。
小样本图像分类基础
- 小样本图像分类在做什么?
- 训练集,验证集和测试集
- 元训练集与元验证集
- 5-way 5-shot
- 支持集与查询集
- SOTA
小样本图像分类中在做什么?
我们知道传统的图像分类,为了训练出一个可以分类的模型,需要的每一类别图片数量是成百上千的;而小样本图像分类,就是只需要少量的图片样本,就能训练出一个用于图像分类的模型。那么这个“少量”是多少呢?一般来说,每类的话是5张图片,或者每类1张图片。
训练集,验证集和测试集
如果你看过了上面前置知识的CNN实现图像分类的视频,那么你对这三个数据集合不会陌生。如果你已经明白这几个名词,但别急,这里还是希望你留意一下,因为小样本图像分类的数据集和任务定义真的很绕…
- 训练集(train)就是我们用于训练CNN的数据集,它会参与到loss计算,反向传播更新参数的过程
- 验证集(validation)则是在模型训练过程中实时监测模型性能的集合,它一般比较小,不参与loss计算与参数更新,就是它与模型无关,是一个“第三方”的检测数据集
- 测试集(test)用于模型训练完成后,测试模型的性能,它通常比验证集大很多,为的是测试模型性能时更准确。
小样本图像分类的模型,大多数分为上游与下游两个阶段。上游阶段我们会训练好一个传统图像分类的网络;下游阶段,我们会用这个网络完成小样本情景下图像分类的任务。
- 传统图像分类里的训练集,对应上游的元训练集,用于模型(骨干网络)的训练
- 而传统分类里的测试集对应下游里的元测试集。
为什么没有元验证集?不提验证集了,怕你晕,而且验证集大多数时候用处不大,很多小样本图像分类论文为了性能直接拿验证集当训练集用了。这里你就忘了它吧。
元训练集与元测试集
元训练集也称meta training set,元测试集也称meta testing set。小样本图像分类的模型,大多数分为上游与下游两个阶段。这两个的概念如上一小节所示,
- 传统图像分类里的训练集,对应上游的元训练集,用于模型(骨干网络)的训练
- 而传统分类里的测试集对应下游里的元测试集。
这里希望大家一定要记清这两个概念,因为很容易和后面的支持集和查询集搞混淆。
支持集与查询集
支持集又称support set,查询集又称query set。首先,明确一点,支持集和查询集都是元测试集的子集! 也就是说,支持集和查询集组成元测试集,用于测试模型的小样本图像分类性能。
如何理解呢?举个例子,我们训练好了小样本图像分类模型,那么应该怎样测试模型的性能呢?用元测试集,而元测试集就是一个个小样本的分类任务。每一个图像分类任务包含用于训练的小训练集和用于测试的小测试集。这里的小训练集就是支持集,而小测试集就是查询集。
所以一个个小的支持集和查询集组成了用于测试模型的元测试集。
5-way 5-shot
我们后面在看论文时,会经常遇见什么“5-way 5-shot”, “5-way 1-shot”这种概念。那么这几个概念是什么意思呢?其中way表示分类的类别个数,shot则表示该类中用于训练模型的图片有几张。例如,
- “5-way 5-shot”则表示该任务是一个五分类的小样本图像分类任务,其中每类用于训练模型图像样本有5张。
- “5-way 1-shot”则表示五分类的任务,每类用于训练的样本有1张。
如下图则是一个3-way 1-shot的分类任务,三种类别,每类一张样本。
综合上一节的支持集与查询集的概念,这里的5-shot即是五张训练样本,也就是支持集。
SOTA
SOTA全程是state of the art。表示当前该领域最高水准的工作。
SOTA不特指任意一个模型,泛成本领域最高水准的工作。
小样本图像分类的思考
关于毕业
如果是你选择小样本图像分类写一个中流211硕士的毕业论文的话,我觉得还是没有问题的。目前紧靠自监督学习的大山,加上前辈们的不懈努力,怎么都可以毕业吧。起码我身边211硕士的毕业论文,还是没什么创新性的,比较水。
关于发论文
仅小样本图像分类领域的论文,个人觉得近两年很大程度依靠骨干网络的发展,比如自监督学习和知识蒸馏。所以只要CV的基础还能创新,小样本图像分类就能“水”。选择这个方向写论文,只要你自己想象力足够,创造一个还行的下游分类方法,性能指标交给前辈的骨干网络和新兴的训练方法,那么发一个B会还是没问题的。
希望大家点点订阅和关注,后续我会不断更新,感谢!