【前沿热点视觉算法|Sora|GPT4相关】-深度无监督显著性检测的多源不确定性挖掘

最新推荐文章于 2024-07-25 11:38:39 发布

fighting的码农(zg)-GPT

最新推荐文章于 2024-07-25 11:38:39 发布

阅读量829

点赞数 22

文章标签：算法 Sora GPT4 SOD 无监督不确定性多源

本文链接：https://blog.csdn.net/qq_43552933/article/details/136333731

版权

计算机视觉算法分享。问题或建议，请文章私信或者文章末尾扫码加微信留言。
sora 具体介绍和使用方法：OpenAI Sora 下一代生产力：最新小白必看教程 | 解剖Sora的前世今生 | Sora核心源码
目前 openai 官方还未开放 sora 灰度，不过根据文生图模型 DALL·E 案例，一定是先给 ChatGPT Plus 付费用户使用，需要注册或者升级 GPT Plus 可以看这个教程:ChatGPT Plus 1分钟一键升级
Youtube、Onlyfans等国外优质服务订阅
ChatGPT充值升级 Plus

1 论文题目

深度无监督显著性检测的多源不确定性挖掘

2 论文摘要

基于深度学习的图像显著目标检测（SOD）严重依赖于带有像素级标记的大规模训练数据。高质量的标签需要密集的劳动，获得成本昂贵。在本文中，我们提出了一种新的多源不确定性挖掘方法，以促进从传统手工SOD方法生成的多个噪声标签中进行无监督深度学习。我们设计了一个由多个合并分割（MS）模块组成的不确定性挖掘网络（UMNet），递归分析多个噪声标签之间的共性和差异，并推断每个标签的像素级不确定性映射。同时，我们利用吉布斯分布对噪声标签进行建模，并提出一种加权不确定性损失，使UMNet联合训练SOD网络。因此，我们的UMNet可以自适应地选择可靠的标签来进行SOD网络学习。在基准数据集上的大量实验表明，我们的方法不仅优于现有的无监督方法，而且与完全监督的最先进的模型相当。

3 论文创新点

开发一种新的深度无监督SOD范式，自动学习从多个源的噪声伪源中挖掘可靠的标签，从而实现更有效的无监督学习。
提出了一种合并分割模块，通过同时分析多源噪声标签的共性和差异，帮助不确定性挖掘网络有效地捕获伪标签的周围像素可靠性。
提出了一种不确定性加权损失函数，该方法将噪声标签建模为吉布斯分布，允许整个网络以优雅的方式进行联合训练，无需不确定性注释。

4 论文架构

在这里插入图片描述

5 不足之处

在这里插入图片描述

如图6所示，当所有的伪标签都达成一致，但标签值错误时，我们的UMNet无法捕捉到这些噪声，并做出错误的估计，阻碍了SODNet的学习。在无监督的情况下，在没有任何其他参考的情况下，很难规避这种问题。探索更复杂的先验知识或学习机制可能是一个有前途的解决方案，我们希望作为我们未来的工作。

6 未来展望

7 论文地址

https://openaccess.thecvf.com/content/CVPR2022/html/Wang_Multi-Source_Uncertainty_Mining_for_Deep_Unsupervised_Saliency_Detection_CVPR_2022_paper.html

8 论文代码

计算机视觉最新进展-Sora

计算机视觉算法分享。问题或建议，请文章私信或者文章末尾扫码加微信留言。
sora 具体介绍和使用方法：OpenAI Sora 下一代生产力：最新小白必看教程 | 解剖Sora的前世今生 | Sora核心源码
目前 openai 官方还未开放 sora 灰度，不过根据文生图模型 DALL·E 案例，一定是先给 ChatGPT Plus 付费用户使用，需要注册或者升级 GPT Plus 可以看这个教程:ChatGPT Plus 1分钟一键升级
Youtube、Onlyfans等国外优质服务订阅
ChatGPT充值升级 Plus

如有其他疑问可以加以下微信二维码联系
更多计算机视觉最新最先进算法请扫描关注以下公众号
-
参考：https://openai.com/sora

fighting的码农(zg)-GPT

关注

22
点赞
踩
28

收藏

觉得还不错? 一键收藏
打赏
0
评论
【前沿热点视觉算法|Sora|GPT4相关】-深度无监督显著性检测的多源不确定性挖掘

基于深度学习的图像显著目标检测（SOD）严重依赖于带有像素级标记的大规模训练数据。高质量的标签需要密集的劳动，获得成本昂贵。在本文中，我们提出了一种新的多源不确定性挖掘方法，以促进从传统手工SOD方法生成的多个噪声标签中进行无监督深度学习。我们设计了一个由多个合并分割（MS）模块组成的不确定性挖掘网络（UMNet），递归分析多个噪声标签之间的共性和差异，并推断每个标签的像素级不确定性映射。同时，我们利用吉布斯分布对噪声标签进行建模，并提出一种加权不确定性损失，使UMNet联合训练SOD网络。
复制链接

扫一扫