论文阅读笔记《TransMatch: A Transfer-Learning Scheme for Semi-Supervised Few-Shot Learning》

小样本学习&元学习经典论文整理||持续更新

核心思想

  本文提出一种基于迁移学习的半监督小样本学习算法(TransMatch)。整个算法并不复杂,首先利用带有标签的基础数据集训练特征提取网络,然后用该特征提取网络为新的数据集初始化分类器权重,最后用半监督学习的方式进一步更新整个网络。整个流程如下图所示
在这里插入图片描述
  第一阶段:预训练阶段。这一阶段没有什么值得介绍的,就是用带有标签的基础数据集对特征提取器进行训练。
  第二阶段:分类器权重“生成”阶段(Classifier Weight Imprinting)。在这一阶段,使用已经预训练好的特征提取网络,对新的带有标签的数据集进行特征提取,并生成对应的分类器权重。本文采用一种叫做Weight Imprinting的方法来生成分类器的权重,方法如下
在这里插入图片描述
式中 w c w_c wc表示类别 c c c对应的分类器权重, f e f^e fe表示特征提取网络, x k c x^c_k xkc表示类别 c c c中第 k k k个样本。通过上式得到每个类别对应的权重后,再通过计算余弦距离的方式进行分类
在这里插入图片描述
式中对于样本 x x x,分别计算其与 N N N个类别权重之间的余弦相似度,并选择余弦相似度最高的哪一类作为预测结果。
  第三阶段:半监督微调训练阶段。在这一阶段采用新的带有标签的数据集 D n o v e l D^{novel} Dnovel和与 D n o v e l D^{novel} Dnovel类别相同但不带有标签的数据集,共同对网络进行微调训练。本文采用MixMatch的方式进行半监督训练,定义 L = { ( x i , p i ) } i = 1 B \mathcal{L}=\left \{(x_i,p_i)\right \}^B_{i=1} L={(xi,pi)}i=1B表示 B B B个带有标签 p i p_i pi的样本, U = { ( x u ) } u = 1 U \mathcal{U}=\left \{(x_u)\right \}^U_{u=1} U={(xu)}u=1U表示 U U U个不带有标签的样本。首先对每个无标签的样本 x u x_u xu进行数据扩充(应该采用的是常规的翻转,放缩等形式)得到 M M M个合成样本 { x u , i , . . . , x u , M } \left \{x_{u,i},...,x_{u,M}\right \} {xu,i,...,xu,M},然后用第二阶段训练得到的分类器对每个无标签样本进行预测,并取 M M M个合成样本的平均值作为预测结果
在这里插入图片描述
锐化操作(sharpen operation)用于进一步增强预测结果
在这里插入图片描述
其中 T = 0.5 T=0.5 T=0.5,这样就得到了无标签样本对应的标签信息了。将数据集 L , U \mathcal{L,U} L,U级联后,再将顺序打乱,得到新的混合数据集 W = S h u f f l e ( C o n c a t ( L , U ) ) \mathcal{W}=Shuffle(Concat(\mathcal{L,U})) W=Shuffle(Concat(L,U)),然后将其分为以下两个集合
在这里插入图片描述
其中混合操作MixUP计算过程如下
在这里插入图片描述
式中 λ ′ = m a x ( λ , 1 − λ ) \lambda'=max(\lambda,1-\lambda) λ=max(λ,1λ) λ \lambda λ是从Beta分布 B e t a ( α , α ) Beta(\alpha,\alpha) Beta(α,α)中随机生成的。

实现过程

网络结构

  特征提取网络采用宽阔的残差网络WRN-28-10。

损失函数

  损失函数计算过程如下
在这里插入图片描述
其中
在这里插入图片描述
在这里插入图片描述

训练策略

  本文的训练过程如下
在这里插入图片描述

创新点

  • 采用基于迁移学习的半监督训练方法实现小样本学习任务
  • 采用Weight Imprinting的方式进行分类器权重生成,采用MixUp方式进行半监督训练

算法评价

  与之前研究较多的采用元学习的小样本学习方法不同,本文沿用了更为传统的迁移学习思想,并结合半监督学习方式,证明了迁移学习还是能够在小样本场景下取得较好的效果的。但本文核心创新点并不多,有一种拼凑的感觉。无论是Weight Imprinting分类器权重生成还是MixUp半监督训练方法都是借鉴了别人的方案。

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。在这里插入图片描述

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

深视

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值