【论文阅读】Learning Spatial Regularization with Image-level Supervisionsfor Multi-label Image Classifica

yepoyou

于 2021-11-19 22:44:00 发布

阅读量225

点赞数

分类专栏：多标签识别 # 深度学习 # 神经网络文章标签：神经网络 cnn

原文链接：https://www.cnblogs.com/White-xzx/

版权

深度学习同时被 3 个专栏收录

13 篇文章 1 订阅

订阅专栏

13 篇文章 2 订阅

订阅专栏

多标签识别

7 篇文章 1 订阅

订阅专栏

目录

SRN网络结构

SRN：注意力机制 fatt(·)

SRN：fsr(·)结构

Multiple Steps 分步训练

SRN

空间正则化网络(Spatial Regularization Network, SRN)，学习所有标签间的注意力图(attention maps)，并通过可学习卷积挖掘标签间的潜在关系，结合正则化分类结果和 ResNet-101 网络的分类结果，以提高图像分类表现。

SRN的优势

挖掘图像多标签之间的语义和空间关联性，较大地提高精度
当网络模型对具有空间相关标签的图片训练后，注意力机制自适应地关注图像的相关区域
图像级标注，端到端训练

SRN网络结构

Main Net：ResNet-101，针对各标签分别学习得到独立的分类器。“Res-2048” 表示具有2048输出的 ResNet 网络模块；
SRN 采用ResNet-101的视觉特征作为输入，利用注意力机制学习得到标签间的正则空间关系；
结合主网络和SRN的分类结果得到最终的分类置信度；

SRN：注意力机制 fatt(·)

当图像存在某个标签时，更多的注意力应该放在相关的区域，标签注意力图编码了标签对应的丰富空间信息。l被标记则l相关区域的注意力值应该更高

注意力图能用于产生更鲁棒的空间正则信息，但每个标签的注意力图总是和为1，可能会突出错误位置，造成错误的空间正则信息，论文提出使用加权注意力图U，U解码了标签局部和全局的置信分数。

SRN：fsr(·)结构

conv2、conv3多通道，512输出，捕捉多标签的语义关系；
conv4单通道，2048输出，4个kernel为一组缠绕1个相同的特征通道，不同kernel捕捉语义关联标签间的不同空间关系。

Multiple Steps 分步训练

只训练主网络, 基于 ResNet，pretrained on ImageNet，fcnn 和 fcls；
固定 fcnn 和 fcls, 训练 fatt
固定 fcnn, fcls和 fatt，训练 fsr；
联合训练整个网络。

图像增强策略：

resize为256×256
裁剪4个角和中心区域，长宽在{256,224,192,168,128}中随机选取
resize为224×224

实验结果

神经元在这四个标签（“男性”、“长袖”、“正式”、“长裤”）之间存在很强的空间和语义关系。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文阅读】Learning Spatial Regularization with Image-level Supervisionsfor Multi-label Image Classifica

SRN空间正则化网络(Spatial Regularization Network, SRN)，学习所有标签间的注意力图(attention maps)，并通过可学习卷积挖掘标签间的潜在关系，结合正则化分类结果和 ResNet-101 网络的分类结果，以提高图像分类表现。SRN的优势挖掘图像多标签之间的语义和空间关联性，较大地提高精度当网络模型对具有空间相关标签的图片训练后，注意力机制自适应地关注图像的相关区域图像级标注，端到端训练SRN网络结构Main Net：ResN.
复制链接

扫一扫

专栏目录

yepoyou CSDN认证博客专家 CSDN认证企业博客

码龄8年

84: 原创

31万+: 周排名

43万+: 总排名

10万+: 访问

: 等级

1268: 积分

29: 粉丝

85: 获赞

14: 评论

498: 收藏

私信

关注

热门文章

分类专栏

注意力 3篇
多标签识别 7篇
语言 12篇
Python 26篇
Java 1篇
Linux 7篇
微服务 1篇
编译器 2篇
爬虫 12篇
机器学习 6篇
图像处理 2篇
神经网络 13篇
pytorch
深度学习 13篇
Java web 14篇
Spring 3篇

最新评论

【Linux】PKG_CONFIG_PATH
biomooc: 显然是 LD_LIBRARY_PATH
【论文阅读】[ML-GCN] Multi-Label Image Recognition with Graph Convolutional Networks
2301_80844976: 出现这个错误是为什么啊？ FileNotFoundError: [Errno 2] No such file or directory: '/data/coco/coco\\data/annotations\\instances_train2014.json'
【论文阅读】[ML-GCN] Multi-Label Image Recognition with Graph Convolutional Networks
快乐学习呢: 文章提炼总结得很好
【数据分析】统计json文件中类别信息并可视化
z*xy: 您好，我最近正在学习文本解析这方面的知识，可以发一份您的数据集给我吗，谢谢。邮箱3072683664@qq.com
【Linux】PKG_CONFIG_PATH
老梁子wes: “在GTK+及其依赖库的安装过程中对于库的搜索路径的设置将采用第一种方式进行”，这个“第一种方式”，是设置LD_LIBRARY_PATH，还是“为了使库的设置变得简单一些，可以把下面的这两句设置保存到一个文件中”避免新旧版本冲突的方法

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。