Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification

pursuing1

于 2023-05-16 21:52:41 发布

阅读量55

点赞数

文章标签：计算机视觉机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pursuing1/article/details/130676793

版权

模型框架

特征提取器：使用预训练的卷积神经网络（CNN）模型，如ResNet或VGG，来提取输入图像的特征表示。

空间正则化模块：该模块旨在学习每个标签在图像中的空间位置，并将这些位置信息用于提高分类准确性。该模块由两个子模块组成：

位置感知模块：学习每个标签在图像中的位置，它将特征图划分成若干个块，并在每个块中学习一个标签的位置权重。
空间注意力模块：利用位置感知模块学习到的位置权重，对特征图进行加权，以提高每个标签的分类准确性。

标签分类器：将经过空间正则化模块的特征图送入多个二元分类器中，每个分类器对应一个标签，输出该标签是否出现在图像中的概率。

Main Net就是一个ResNet.

在Feature Map进行分支，将其通过fatt注意力机制。得到为未归一化的标签注意值。再利用它softmax来获取空间归一化。

这个fatt步骤为

将输入的图像通过一个卷积神经网络 (CNN) 提取出一系列的特征图。
对这些特征图进行空间金字塔池化 (Spatial Pyramid Pooling, SPP) 操作，得到不同尺度的特征向量。
对每个尺度的特征向量进行 L2 归一化，以消除尺度差异。
对归一化后的特征向量进行全连接层映射，得到一个新的向量。
对新的向量进行 Sigmoid 操作，并与原始特征图进行元素级别相乘，得到增强后的特征图。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification

标签分类器：将经过空间正则化模块的特征图送入多个二元分类器中，每个分类器对应一个标签，输出该标签是否出现在图像中的概率。空间正则化模块：该模块旨在学习每个标签在图像中的空间位置，并将这些位置信息用于提高分类准确性。位置感知模块：学习每个标签在图像中的位置，它将特征图划分成若干个块，并在每个块中学习一个标签的位置权重。空间注意力模块：利用位置感知模块学习到的位置权重，对特征图进行加权，以提高每个标签的分类准确性。对新的向量进行 Sigmoid 操作，并与原始特征图进行元素级别相乘，得到增强后的特征图。
复制链接

扫一扫

pursuing1 CSDN认证博客专家 CSDN认证企业博客

码龄5年

3: 原创

168万+: 周排名

159万+: 总排名

345: 访问

: 等级

34: 积分

1: 粉丝

1: 获赞

3: 评论

0: 收藏

私信

关注

热门文章

最新评论

HCP: A Flexible CNN Framework forMulti-Label Image Classification的理解
CSDN-Ada助手: 非常感谢您写的这篇博客，对于我这个初学者来说非常有帮助。您的理解非常清晰准确，让我对HCP这个CNN框架有了更深的认识。除此之外，如果您想要深入了解多标签图像分类，可以学习一些相关的技能，比如目标检测、语义分割等，这些技能会对您未来的研究和实践非常有帮助。希望您能够继续分享自己的学习心得，我们一起进步！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2 如果您持续创作，完成第三篇博客，并且质量分达到 80 分以上，在评论区就有机会获得红包奖励哦！
Learning Spatial Regularization with Image-level Supervisions for Multi-label Image Classification
CSDN-Ada助手: 恭喜你又写了一篇非常有价值的博客！从标题上看，你似乎在探索如何通过图像级别的监督学习来实现多标签图像分类中的空间规则化。这听起来非常有趣，我很期待你在文章中分享更多的细节和研究成果。同时，建议你在后续的创作中，可以考虑从实践角度出发，给出一些案例和实验结果，更加有助于读者的理解和应用。再次感谢你的分享和努力！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3
Multi-label Image Classification with Regional Latent Semantic Dependencies（RLSD）的文章理解
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
Multi-label Image Classification with Regional Latent Semantic Dependencies（RLSD）的文章理解
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/615171295。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。