半监督训练方法--mean teachers are better role models

最新推荐文章于 2024-05-12 21:28:48 发布

imperfect00

最新推荐文章于 2024-05-12 21:28:48 发布

阅读量5.8k

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011961856/article/details/84063663

版权

深度学习专栏收录该内容

71 篇文章 2 订阅

订阅专栏

本文采用两个网络进行训练，连个网络模型结构一样，分别命名为teacher,student网络。student网络参数根据损失函数梯度下降法更新得到；teacher网络参数通过student网络的参数迭代得到。

训练数据：

有标签样本x1,y1,以及无标签样本x2.

训练策略：

将有标签数据x1,y1输入student,从而计算loss1.

将无标签数据x2输入student,从而计算得到label1

将无标签数据x2输入teacher,从而计算得到label2

我们希望两个网络的预测标签尽量相等，因此根据lable1,label2得到损失函数loss2.

根据loss=loss1+loss2更新student网络。

在每个step中，更新student网络参数后，再利用student网络的参数更新teacher网络参数，

在这里插入图片描述
github代码：https://github.com/CuriousAI/mean-teacher

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
3
评论
半监督训练方法--mean teachers are better role models

本文采用两个网络进行训练，连个网络模型结构一样，分别命名为teacher,student网络。student网络参数根据损失函数梯度下降法更新得到；teacher网络参数通过student网络的参数迭代得到。训练数据：有标签样本x1,y1,以及无标签样本x2.训练策略：将有标签数据x1,y1输入student,从而计算loss1.将无标签数据x2输入student,从而计算得到label...
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。