- 计算机视觉算法分享。问题或建议,请文章私信或者文章末尾扫码加微信留言。
- sora 具体介绍和使用方法:OpenAI Sora 下一代生产力:最新小白必看教程 | 解剖Sora的前世今生 | Sora核心源码
- 目前 openai 官方还未开放 sora 灰度,不过根据文生图模型 DALL·E 案例,一定是先给 ChatGPT Plus 付费用户使用,需要注册或者升级 GPT Plus 可以看这个教程:ChatGPT Plus 1分钟一键升级
- Youtube、Onlyfans等国外优质服务订阅
- ChatGPT充值升级 Plus
1 论文题目
- 深度无监督显著性检测的多源不确定性挖掘
2 论文摘要
- 基于深度学习的图像显著目标检测(SOD)严重依赖于带有像素级标记的大规模训练数据。高质量的标签需要密集的劳动,获得成本昂贵。在本文中,我们提出了一种新的多源不确定性挖掘方法,以促进从传统手工SOD方法生成的多个噪声标签中进行无监督深度学习。我们设计了一个由多个合并分割(MS)模块组成的不确定性挖掘网络(UMNet),递归分析多个噪声标签之间的共性和差异,并推断每个标签的像素级不确定性映射。同时,我们利用吉布斯分布对噪声标签进行建模,并提出一种加权不确定性损失,使UMNet联合训练SOD网络。因此,我们的UMNet可以自适应地选择可靠的标签来进行SOD网络学习。在基准数据集上的大量实验表明,我们的方法不仅优于现有的无监督方法,而且与完全监督的最先进的模型相当。
3 论文创新点
- 开发一种新的深度无监督SOD范式,自动学习从多个源的噪声伪源中挖掘可靠的标签,从而实现更有效的无监督学习。
- 提出了一种合并分割模块,通过同时分析多源噪声标签的共性和差异,帮助不确定性挖掘网络有效地捕获伪标签的周围像素可靠性。
- 提出了一种不确定性加权损失函数,该方法将噪声标签建模为吉布斯分布,允许整个网络以优雅的方式进行联合训练,无需不确定性注释。
4 论文架构
5 不足之处
- 如图6所示,当所有的伪标签都达成一致,但标签值错误时,我们的UMNet无法捕捉到这些噪声,并做出错误的估计,阻碍了SODNet的学习。在无监督的情况下,在没有任何其他参考的情况下,很难规避这种问题。探索更复杂的先验知识或学习机制可能是一个有前途的解决方案,我们希望作为我们未来的工作。
6 未来展望
- 无
7 论文地址
- https://openaccess.thecvf.com/content/CVPR2022/html/Wang_Multi-Source_Uncertainty_Mining_for_Deep_Unsupervised_Saliency_Detection_CVPR_2022_paper.html
8 论文代码
- 无
计算机视觉最新进展-Sora
- 计算机视觉算法分享。问题或建议,请文章私信或者文章末尾扫码加微信留言。
- sora 具体介绍和使用方法:OpenAI Sora 下一代生产力:最新小白必看教程 | 解剖Sora的前世今生 | Sora核心源码
- 目前 openai 官方还未开放 sora 灰度,不过根据文生图模型 DALL·E 案例,一定是先给 ChatGPT Plus 付费用户使用,需要注册或者升级 GPT Plus 可以看这个教程:ChatGPT Plus 1分钟一键升级
- Youtube、Onlyfans等国外优质服务订阅
- ChatGPT充值升级 Plus
-
如有其他疑问可以加以下微信二维码联系
-
更多计算机视觉最新最先进算法请扫描关注以下公众号
-