【噪声学习】SELFIE:更新不干净样本的鲁棒性深度学习

SELFIE: Refurbishing Unclean Samples for Robust Deep Learning

摘要:

        由于深度神经网络具有极高的表达能力,其副作用是即使在标签噪声极高的情况下也能完全记住训练数据。为了克服对噪声标签的过度拟合,我们提出了一种名为 SELFIE 的新型鲁棒训练方法。我们的主要想法是有选择地翻新和利用可以高精度修正的不干净样本,从而逐步增加可用训练样本的数量。利用这一设计优势,SELFIE 有效地防止了错误修正带来的噪声积累风险,并充分利用了训练数据。为了验证 SELFIE 的优越性,我们使用四个真实世界或合成数据集进行了大量实验。结果表明,与两种最先进的方法相比,SELFIE 显著改善了绝对测试误差。 

 介绍:

        随着可用数据集规模的快速增长,深度神经网络在图像分类(Krizhevsky 等人,2012 年)和物体检测(Redmon 等人,2016 年)等众多机器学习任务中取得了不俗的表现。然而,由于神经网络具有很强的适应任何噪声标签的能力,众所周知,训练数据中的一小部分错误标签样本会严重影响模型的性能。特别是,Zhang 等人(2017)的研究表明,标准卷积神经网络可以以任意比例的噪声标签拟合整个训练数据,并最终导致测试数据的泛化效果不佳。因此,问题的关键在于如何在训练数据中存在错误标签样本的情况下仍能稳健地训练深度神经网络。 

        一种典型的方法是使用 "loss修正",根据估计的噪声修正训练样本的loss过渡矩阵(Zhang 等人,2017;Goldberger & BenReuven,2017;Patrini 等人,2017;Chang 等人,2017)。如图 1(a)所示,每个迷你批次中所有样本的前向或后向损失都会被修正,随后反向传播以更新网络。然而,由于噪声转换矩阵难以估计,网络不可避免地会积累因错误校正而产生的误差,尤其是在类数或误标样本数较多时(Jiang 等,2018;Han 等,2018)。

 

        为了摆脱错误修正,最近的许多研究都采用了 "样本选择",即从训练数据中过滤出真实标签样本(Kumar 等,2010;Jiang 等,2018;Han 等,2018)。他们根据前向损失从迷你批次中识别出干净样本,并用它们来更新网络,如图 1(b) 所示。在实践中,Han 等人(2018 年)的研究表明,在极高噪声数据上,对干净样本进行训练比校正整个样本的性能要好得多。然而,专注于选定的干净样本会偏向于容易样本,从而忽略大量有用的硬样本,而这些样本会使网络更加准确和鲁棒(Shrivastava 等人,2016 年;Chang 等人,2017 年;Lin 等人,2018 年)。因此,为了在有噪声的标签上进行更稳健的训练,我们建议翻新不干净的样本ÿ

  • 30
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
selfie_segmentation_solution_simd_wasm_bin.js 是一个自拍分割解决方案的 JavaScript 文件。该文件利用 SIMD (单指令多数据) 和 WebAssembly 技术实现了自拍分割功能,并以二进制格式保存。 自拍分割是一种利用计算机视觉技术将自拍照片中的人物主体与背景进行分离的方法。这种技术可以应用于很多场景,比如制作虚化背景效果、替换背景、添加特效等等。 SIMD 是一种并行计算技术,它使用单个指令同时对多个数据进行操作,可以提高计算效率。由于自拍分割需要对图像中的每个像素进行计算,利用 SIMD 可以加快分割速度,使得实时应用变得可能。 WebAssembly (简称wasm) 则是一种基于低级汇编语言的二进制格式,它可以在现代浏览器中运行,提供了更高性能的计算能力。通过将自拍分割算法编译为 wasm 格式,可以在浏览器中快速加载和执行算法,而无需依赖于服务器端的计算资源。 selfie_segmentation_solution_simd_wasm_bin.js 文件包含了已经编译为 wasm 格式的自拍分割算法的二进制数据,可以通过浏览器的 WebAssembly 接口加载并使用。使用这个文件,开发者可以轻松地将自拍分割功能集成到自己的网页应用中,实现各种有趣的效果。 总结来说,selfie_segmentation_solution_simd_wasm_bin.js 是一个实现自拍分割功能的 JavaScript 文件,利用了 SIMD 和 WebAssembly 技术提高了计算效率和性能,可以在浏览器中快速加载和执行。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

木木要早睡

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值