【前沿热点视觉算法|Sora|GPT4相关】-深度无监督显著性检测的多源不确定性挖掘

1 论文题目

  • 深度无监督显著性检测的多源不确定性挖掘

2 论文摘要

  • 基于深度学习的图像显著目标检测(SOD)严重依赖于带有像素级标记的大规模训练数据。高质量的标签需要密集的劳动,获得成本昂贵。在本文中,我们提出了一种新的多源不确定性挖掘方法,以促进从传统手工SOD方法生成的多个噪声标签中进行无监督深度学习。我们设计了一个由多个合并分割(MS)模块组成的不确定性挖掘网络(UMNet),递归分析多个噪声标签之间的共性和差异,并推断每个标签的像素级不确定性映射。同时,我们利用吉布斯分布对噪声标签进行建模,并提出一种加权不确定性损失,使UMNet联合训练SOD网络。因此,我们的UMNet可以自适应地选择可靠的标签来进行SOD网络学习。在基准数据集上的大量实验表明,我们的方法不仅优于现有的无监督方法,而且与完全监督的最先进的模型相当。

3 论文创新点

  • 开发一种新的深度无监督SOD范式,自动学习从多个源的噪声伪源中挖掘可靠的标签,从而实现更有效的无监督学习。
  • 提出了一种合并分割模块,通过同时分析多源噪声标签的共性和差异,帮助不确定性挖掘网络有效地捕获伪标签的周围像素可靠性。
  • 提出了一种不确定性加权损失函数,该方法将噪声标签建模为吉布斯分布,允许整个网络以优雅的方式进行联合训练,无需不确定性注释。

4 论文架构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

5 不足之处

在这里插入图片描述

  • 如图6所示,当所有的伪标签都达成一致,但标签值错误时,我们的UMNet无法捕捉到这些噪声,并做出错误的估计,阻碍了SODNet的学习。在无监督的情况下,在没有任何其他参考的情况下,很难规避这种问题。探索更复杂的先验知识或学习机制可能是一个有前途的解决方案,我们希望作为我们未来的工作。

6 未来展望

7 论文地址

  • https://openaccess.thecvf.com/content/CVPR2022/html/Wang_Multi-Source_Uncertainty_Mining_for_Deep_Unsupervised_Saliency_Detection_CVPR_2022_paper.html

8 论文代码

计算机视觉最新进展-Sora

  • 如有其他疑问可以加以下微信二维码联系
    在这里插入图片描述

  • 更多计算机视觉最新最先进算法请扫描关注以下公众号
    -在这里插入图片描述

  • 参考:https://openai.com/sora

  • 22
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fighting的码农(zg)-GPT

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值