文献阅读：Unsupervised Label Noise Modeling and Loss Correction

最新推荐文章于 2024-06-18 10:32:35 发布

Jay——小白

最新推荐文章于 2024-06-18 10:32:35 发布

阅读量561

点赞数 2

分类专栏：文献阅读文章标签：机器学习深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_44766147/article/details/129527647

版权

文献阅读专栏收录该内容

11 篇文章 1 订阅

订阅专栏

文献阅读：Unsupervised Label Noise Modeling and Loss Correction

Abstract

CNN网络一般有这个性质，在面对有噪声的数据时，一般先拟合干净数据，再拟合噪声数据。
基于每个样本的简单但有效的无监督噪声标签建模。
一种损失校正方法，利用无监督标签噪声模型来校正每个样本损失，从而防止对标签噪声的过度拟合。
加入一个混合增强模型能够更一步提高精度

一般的分类损失
在这里插入图片描述

1.随机的标签比干净的标签训练时间更长。
2.并且随机的标签在刚开始训练的时候有更大的损失。

混合模型是一种广泛使用的无监督建模技术
在这里插入图片描述

高斯分布对干净集分布的近似很差，Clean集表现出向零的高度偏斜。β混合模型（BMM）更好地近似了干净样本和噪声样本混合物的损失分布（图2）。

通俗来说：
第一步：通过cross-entropy得到的loss分布来判断样本是noisy还是clean的概率
第二步：使用这个概率来动态地调整loss function，使用该loss来训练

使用BMM来建模，也就是贝塔混合模型
K=2, 也就是有两种情况，一个是干净的标签，一个是噪声标签。

在这里插入图片描述

在这里插入图片描述

总体的混合分布如上，我们给定每个 k 的贝塔参数和 loss 值，就可以得到这个 loss 值对应的总体的分布了：
当我们赋予这个BMM初始的 α 和 β 值后，如何根据观测到的损失值更新这两个值呢？
这里我们就有一种EM算法，来专门拟合这种含有隐变量的概率分布问题：

E-STEP

表示出后验分布，也就是给定loss, 判断这个loss是属于clean-label还是noisy-label

在这里插入图片描述
M-STEP
估计分布参数

在这里插入图片描述

在这里插入图片描述

然后重复上述E和M步骤，直到达到收敛或最大迭代次数

k=0(1) 分别代表干净（噪声样本）

直接使用分类损失会导致病态的拟合，因为它拟合了噪音标签。
所以采用static hard bootstrapping, 它可以通过添加一个额外的项去处理噪音标签。（模型预测zi，softmax probabilities hi）

在这里插入图片描述

干净的样本依赖于它们的真值标签yi（1−wi较大）
而有噪声的样本则让它们的损失由它们的类别预测zi（wi较大）

混淆数据增强
在这里插入图片描述

混淆机制和bootstrapping结合
在这里插入图片描述

这种组合使网络正则化，并且远离了振荡。这种组合提供了一种组合干净和噪声样本的机制。即使这两个组合的情况都是噪声，也有效，因为这是两组数据融合，一组数据的标签可能就是另一组数据的标签。并且这种机制能够防止对噪音数据的过拟合。
在高噪声的情况下，我们得到的两组混淆数据都存在噪声是普遍的情况。所以我们将混淆机制和bootstrapping融合。这可以利用两者的好处：
mixup：使得网络正则化，远离震荡。
bootstrapping：加入了网络自己预测的标签，可以改善随机选取的两组数据都是噪声的情况。

防止网络倾向于预测相同的标签
在高噪声水平下，大多数样本由网络在损失中的预测引导，鼓励网络预测相同的类别以最小化损失。使用正则化项去避免这种情况

在这里插入图片描述

pc表示c类的先验概率分布，在这里插入图片描述是数据集中所有样本中c类模型的平均软最大概率。Pc = 1 / C

Experiment

在这里插入图片描述
在高水平的标签噪声下的hard bootstrapping会导致损耗的巨大变化，从而导致性能下降。
通过修改以下内容中的软最高温度T来实现SH，线性地降低hp和hq的温度

在这里插入图片描述

sij表示在样本xi的CNN模型j类的最后一层中获得的分数

Jay——小白

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
文献阅读：Unsupervised Label Noise Modeling and Loss Correction

文献阅读：Unsupervised Label Noise Modeling and Loss Correction
复制链接

扫一扫

专栏目录

Jay——小白 CSDN认证博客专家 CSDN认证企业博客

码龄5年

17: 原创

132万+: 周排名

17万+: 总排名

1万+: 访问

: 等级

211: 积分

11: 粉丝

35: 获赞

9: 评论

59: 收藏

私信

关注

热门文章

分类专栏

bug 1篇
文献阅读 11篇

最新评论

RuntimeError: CUDA error: invalid device ordinal CUDA kernel errors might be asynchronously reported
爱鞋小姐: 可能你需要每次跑测前先把cuda环境变量设置为空export CUDA_VISIBLE_DEVICES=
RuntimeError: CUDA error: invalid device ordinal CUDA kernel errors might be asynchronously reported
潇湘潞: 您好，您知道原因了吗？我也遇到和你相同的情况了，
RuntimeError: CUDA error: invalid device ordinal CUDA kernel errors might be asynchronously reported
CSDN-Ada助手: 恭喜您写了第16篇博客！标题“RuntimeError: CUDA error: invalid device ordinal CUDA kernel errors might be asynchronously reported”听起来非常专业。我很高兴看到您在持续创作，并且处理了这个困扰您的错误。对于下一步的创作建议，我谨虚心地建议您可以分享一些关于如何优化CUDA代码的经验或者其他与CUDA相关的主题。期待您的下一篇博客！
pickle.UnpicklingError: pickle data was truncated报错的问题
CSDN-Ada助手: 恭喜您写出了第12篇博客！标题“pickle.UnpicklingError: pickle data was truncated报错的问题”非常引人注目。阐述解决pickle数据截断错误的问题是非常有帮助的。您的解释非常清晰，让读者能够更好地理解这个错误并找到解决方案。我建议您在未来的创作中可以考虑深入探讨一些pickle模块中的其他常见错误，并提供实用的解决方法。这样的话，读者们可以在遇到其他问题时，能够更好地理解和解决。期待您未来更多的博客作品！请继续保持您的创作热情，我们都很期待您的下一篇博客。谦虚地说，您的分享对我们这些读者来说真的很有帮助。加油！
anaconda navigator一直卡在adding featured channels界面
CSDN-Ada助手: 恭喜您持续创作，第13篇博客标题“anaconda navigator一直卡在adding featured channels界面”引起了我的兴趣。您的博客内容一直都很有深度和实用性，能够帮助很多人解决类似问题。在这篇博客中，您描述了遇到的问题，并探索了可能的解决方案。在下一步的创作中，我建议您可以尝试更多的技术探索，比如尝试不同的方法来解决这个问题。您可以尝试与其他开发者交流，了解他们在使用anaconda navigator时是否遇到类似的问题，并向他们请教解决方法。另外，您也可以尝试探索其他与anaconda相关的主题，比如如何优化其性能或如何在其中使用不同的库。总之，您的博客一直都很有帮助，我期待着您未来更多的创作。请保持谦虚的态度，继续分享您的知识和经验！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。