论文阅读——Mean teachers are better role models

摘要: Temporal Ensembling方法通过预测的标签的EMA,并且通过保证ensemle 模型和 trained模型预测标签的连续一致性,从而保证训练得到的ensemle模型尽可能的接近groud truth模型。这里可以理解为,如果如果模型是正确的,那么前后两个模型的预测标签应该是接近的,并且变化较小的,那么使模型向使两个模型预测结果接近的方向移动,就是向groudtruth model移动。这种方法,每一个epoch标签数据仅仅会改变一次,对于大规模数据,或者在线学习问题,该方法就不能很好的适用本文提出了平均权重的方法,而不是Temporal Ensembling中采用的label平均的方法,可以在每一个training step更新teacher model,及时的指导student model的学习。在ImageNet 2012上,使用10%的labels,将top5的精度误差率从35.24%下降9.11%。

标题: Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results
作者: Antti Tarvainen等
年份: NIPS 2017
Github: https://github.com/CuriousAI/mean-teacher

2. Mean Teacher

1)算法流程
在这里插入图片描述

  1. 第一步,构建一个普通的监督模型;

  2. 第二步,把监督学习模型对它copy一份,原模型叫做student,另一个叫teacher;

  3. 第三步,在每训练步(step)中,使用同样的minibatch输入到student与teacher模型中,但在输入数据前分别加入随机增强或者噪声;

  4. 第四步,加入student与teacher输出的一致性损失函数J(consistency cost);
    在这里插入图片描述

  5. 第五步,优化器只更新student的权重;

  6. 第六步,每个训练步(step)之后,采用student权重的EMA(指数移动平均)更新teacher权重
    在这里插入图片描述

2)核心点:

  1. 与П-model类似,有两个模型,但Mean teacher采用了两个不同的模型(student、teacher)
  2. 看做是Temporal ensembling的改进版,在Temporal ensembling中,采用的是每epoch的指数移动平均值来聚合历史数内容,而Mean teacher则是在每训练step进行对Student的权重进指数移动平均;

3. Result

在这里插入图片描述在这里插入图片描述

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值