self-ensemble label filtering

涂漾图森魄

于 2021-01-17 21:12:45 发布

阅读量946

点赞数

分类专栏：样本标签噪声检测文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43702410/article/details/108875322

版权

样本标签噪声检测专栏收录该内容

1 篇文章 0 订阅

订阅专栏

self-ensemble label filtering自集成标签滤波

模型将噪声标签剔除出来，仅对干净的数据训练。

剔除数据

主要思路：模型在训练时，对于那些噪声标签的样本的预测值常常飘忽不定（文章是这么指出的，准备做复现的时候试一试），因此采用信号处理中的滤波，而实现的方法是对模型求均值。

Model ensemble：在训练过程中对模型的参数进行移动平均，当训练数据更新normal model参数时，通过权重的指数移动平均来维护teacher model，同时利用正则项来令两个model尽量保持一致，最后用teacher model的输出作为预测结果；
Predictions ensemble：在不同的epoch上对teacher model的预测值取平均，公式很简单，对于第j个epoch，计算模型输出 z 的指数移动平均z = a * z(j-1) + (1-a) * z，其中 a 是momentum参数。

这样就可以根据平均的预测结果识别出噪声样本，检查该样本的标签和teacher model是否一致，若一致则会被认定为干净样本，否则想、在这个epoch将会被认定为噪声样本且被踢出下一个epoch的训练
在这里插入图片描述

从右图可以看出，做了移动平均之后，噪声标签y的预测概率不高，所以不会参与下一epoch训练

SELF模型流程图

在这里插入图片描述

算法流程

让Mean-Teacher模型对所有样本进行预测
计算预测值的指数移动平均，检查其最大预测值的类别标签是否与给定的标签一致，若不一致则暂时排除出训练集
用过滤后的数据集来训练Mean-Teacher模型
不断重复上述步骤，直到模型在验证集上的性能不再提高

Mean Teacher

算法的整体包括两个网络，teacher网络和 student网络
teacher 是 student网络的一份复制，因此网络结构相同，但是网络更新的方式不同，因此是两个独立的网络

其中 student模型权重 θ \theta θ 输入噪声 η \eta η,
teacher模型权重 θ ′ \theta' θ′ 输入噪声 η ′ \eta' η′

定义了一致性损失（consistency cost) J 衡量 t和s 的预测的距离

J ( θ ) = E x , η ′ , η [ ∥ f ( x , θ ′ , η ′ ) − f ( x , θ , η ) ∥ ] J(\theta)=\mathbb{E}_{x,\eta',\eta}\left [ \left | f(x,\theta',\eta') - f(x,\theta,\eta) \right | \right ] J(θ)=Ex,η′,η[∥f(x,θ′,η′)−f(x,θ,η)∥]

student通过梯度下降更新参数，teacher通过student的参数更新

teacher的参数更新
teacher的参数通过EMA得到

training step θt:

			θ t = α θ（t − 1）  ′ + ( 1 − α ) θ t

student的参数更新
SGD

涂漾图森魄

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
self-ensemble label filtering

self-ensemble label filtering自集成标签滤波模型将噪声标签剔除出来，仅对干净的数据训练。剔除数据主要思路：模型在训练时，对于那些噪声标签的样本的预测值常常飘忽不定（文章是这么指出的，准备做复现的时候试一试），因此采用信号处理中的滤波，而实现的方法是对模型求均值。Model ensemble：在训练过程中对模型的参数进行移动平均，当训练数据更新normal model参数时，通过权重的指数移动平均来维护teacher model，同时利用正则项来令两个model尽量保持
复制链接

扫一扫

专栏目录

涂漾图森魄 CSDN认证博客专家 CSDN认证企业博客

码龄6年

4: 原创

110万+: 周排名

138万+: 总排名

6282: 访问

: 等级

51: 积分

11: 粉丝

16: 获赞

6: 评论

46: 收藏

私信

关注

热门文章

分类专栏

文本摘要 1篇
样本标签噪声检测 1篇

最新评论

NoisyLearning---Divide Mix
嵌入式萌新……: confidence penalty一直为0因为非对称噪声才会用到
NoisyLearning---Divide Mix
嵌入式萌新……: 我看论文里面说两个网络的学习率和初始化参数不一样，但是代码里却是一样的，不知道是不是这个原因导致训练过程相近
多文档的抽取式自动文本摘要
彡春风十里不如你: 太强了，不愧是瓜大学子，学习学习
self-ensemble label filtering
不正经的kimol君: 忍不住就是一个赞，写得很棒，欢迎回赞哦~
多文档的抽取式自动文本摘要
不正经的kimol君: 大佬的文章让我受益匪浅，如痴如醉，以后的日子还希望能够得到大佬的谆谆指点！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。