今天介绍一篇我们组和蚂蚁网商银行在小样本视频分类领域的工作 A Closer Look at Few-Shot Video Classification: A New Baseline and Benchmark,发表于BMVC 2021。现有的小样本视频分类方法往往采用元学习范式并且十分依赖ImageNet预训练,当不使用ImageNet预训练时,这些方法的性能下降严重。
通过实验,我们发现这些方法在表示学习上存在缺陷,并针对这一点提出了基于预训练-微调的方法。此外,我们发现元测试阶段的部分动作类和ImageNet自身的某些类存在高度相关性,这表明使用ImageNet预训练这一做法违背了小样本学习的设定。不使用预训练带来性能下降的另一个原因是现有benchmark的基类样本较少,因此我们重新构建了一个有着充足基类样本的小样本视频分类benchmark以推动在不使用预训练下的小样本视频分类研究。
论文链接:https://www.bmvc2021-virtualconference.com/assets/papers/0190.pdf
代码链接:https://github.com/MCG-NJU/FSL-Video
元学习方法回顾
不同的元学习方法
元学习小样本视频分类方法通常采用基于度量的元学习方法,包含元训练和元测试两个阶段。我们希望在元训练阶段针对基类数据训练的网络能够很好的泛化到元测试阶段的新类上,其中基类包含大量有标签样本,新类仅包