半监督学习调研

本文探讨了半监督学习中的Temporal Ensembling和Mean Teacher方法。Temporal Ensembling利用指数移动平均来集成不同epoch的预测结果,增强模型稳定性;而Mean Teacher通过教师模型的权重平均更新,引导学生模型学习,两者都在无标签数据上引入一致性损失以提高模型性能。
摘要由CSDN通过智能技术生成

半监督学习:少量数据wiz label + 大量数据without label


论文:Temporal Ensembling For Semi-supervised Learning

首先引入一个background knowledge,

Exponential Moving Average:

为撒要叫exponential呢?从公式中可以看到,在当前的vt中,时间上更久远的v所占的成分呈指数级下降,作为对比,Simple Moving Average则是等权平均一段时间内的序列值


Π-model:对网络做dropout regularization(随机丢弃其中的一部分参数),同一输入(无标签数据)复制两份随机加上input augmentation(如翻转、平移、遮挡等)放到网络里跑,输出的差值平方加到原来的损失中进行梯度下降

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值