SSL论文笔记:FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence

Abstraction

两种常用半监督学习领域的方法组合:一致性正则和伪标签(更准确地是artificial labels)

FixMatch方法:

  1. 首先利用模型在未标注数据的弱增强版本上生成一个伪标签;(只保留模型可以高置信度预测的伪标签);

  2. 然后训练该模型,以预测同一图像输入时的强增强版本时的伪标签

在这里插入图片描述

Contribution:

  • SSL领域的SOTA结果
  • 探索了extremely-scarce-labels的情况(一类一个样本),并根据实验结果创建了有趣的几组数据集(从无代表性到有代表性样本)
  • 丰富的消融实验,并囊括了新SSL方法提出时很少提及的基础实验选择(如优化器和学习率策略)

个人觉得其有效的两个原因:

  • strong data augmentation
  • ignoring low-confidence predictions

FixMatch

Algorithm

主要创新性来自于一致性正则和伪标签两种成分的结合,以及在执行一致性正则化时分别使用弱和强增强。

在这里插入图片描述

监督损失 ℓ s \ell_{s} s和无监督损失 ℓ u \ell_{u} u都是CE损失:
ℓ s = 1 B ∑ b = 1 B H ( p b , p m ( y ∣ α ( x b ) ) ) \ell_{s}=\frac{1}{B} \sum_{b=1}^{B} \mathrm{H}\left(p_{b}, p_{\mathrm{m}}\left(y \mid \alpha\left(x_{b}\right)\right)\right) s=B1

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值