《论文笔记》——PUZZLE-CAM: IMPROVED LOCALIZATION VIA MATCHING PARTIAL AND FULL FEATURES

最新推荐文章于 2024-06-09 09:50:28 发布

Shelby-Lee

最新推荐文章于 2024-06-09 09:50:28 发布

阅读量1k

点赞数

文章标签：论文阅读计算机视觉深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46676829/article/details/126816742

版权

摘要：为了缩小从像素级监督到图像级监督的语义分割性能差距，引入了弱监督语义分割(WSSS)。大多数先进的方法是基于类激活映射(CAMs)来生成伪标签来训练分割网络。该方法的主要局限性在于，利用图像分类器从cam中生成伪标签的过程主要集中在目标最具鉴别性的部分。为了解决这个问题，我们提出了Puzzle-CAM，这是一个过程，最大限度地减少来自单独补丁和整个图像之间的特征差异。该方法由一个谜题模块和两个正则化项组成，用于发现对象中最完整的区域。Puzzle-CAM可以激活一个对象的整体区域使用图像级别的监督，而不需要额外的参数。

介绍：以往大多数使用WSSS的方法都是基于类激活映射(CAMs)来获得良好的性能。然而，为了对语义对象进行有效的分类，所生成的分割模型往往只关注语义对象的一小部分，这就阻碍了分割模型对像素级语义知识的学习。此外，我们可以看到，平铺图像中孤立的patch生成的CAMs与原始图像得到的CAMs是不同的。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《论文笔记》——PUZZLE-CAM: IMPROVED LOCALIZATION VIA MATCHING PARTIAL AND FULL FEATURES

因此，该模型在生成图像补丁的同类CAM时，只关注对象的部分来寻找该类的关键特征。因此，图像补丁合并后的。然而，为了对语义对象进行有效的分类，所生成的分割模型往往只关注语义对象的一小部分，这就阻碍了分割模型对像素级语义知识的学习。，以最小化单个图像的CAM与图像补丁合并后的CAM之间的差异。的目标是使用像素相关模块来细化cam，该模块捕捉每个像素的上下文外观信息，并通过学习到的亲和力注意图来改变原始cam。此外，我们可以看到，平铺图像中孤立的patch生成的CAMs与原始图像得到的CAMs是不同的。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。