SSL相关论文总结(四)

TEMPORAL ENSEMBLING FOR SEMI-SUPERVISED LEARNING

这篇论文给出了一种非常有意义的框架,不仅仅是这篇论文,他为后续的半监督研究提供了一个非常棒的思路。

前言

论文很简单,就是两个模型,把这两个模型搞明白就可以了。


一、Π-model

在这里插入图片描述
在这里插入图片描述
我们可以发现,半监督的框架中网络不是最重要的,重要的是寻找更好的方法将labelled data和unlabelled data搭配起来使用。Π模型的流程也很简单,标签yi的那条线是虚线是因为我们在一个minibatch不只有labelled data,还有unlabelled data,如果是后者,那么就没有标签,在计算时只用计算下面这一项就行了,核心就在于损失函数,损失函数由交叉熵和矩阵距离两者组成,而矩阵距离这一带有极强约束性的项,也不能在一开始就给予很大的权重,所以ramp-up从0开始,并且在前八十个training epoch里面沿着高斯曲线变化。
作者在这里还分享了一个发现:他们认为模型在一开始依赖labelled data,然后unlabelled data的权重以一个足够慢的速度去上升是非常关键的(正向),因为如果一开始无标签的权重就不足够小的话,可以预见的时候会求的退化解(基向量中出现线性相关问题)。
补充一点:这里的随机增强会产生不同的输入值,伪代码里非常清楚。

二、时序集成模型

在这里插入图片描述
在这里插入图片描述
这个模型相较于Π模型,可以看到区别在于只有一个输入通道,意思就是每次只会计算一次outputs,但是我们可以看到他会和之前的经验去求矩阵距离,也就是说这里的一致性损失更多的是一种经验推断,不仅节省了一半的计算时间(系数),而且效果上居然也不逊色于Π模型,这确实是我到目前还没有从理性的角度理解清楚的一个问题。
补充一点:伪代码里面N是minibatch大小,C是类别数,不是NCHW里的C。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值