20-CVPR-Multi-branch and Multi-scale Attention Learning for Fine-Grained Visual Categorization

大坡山小霸王

已于 2022-06-16 20:36:01 修改

阅读量2k

点赞数 1

分类专栏：细粒度文章标签：深度学习

于 2022-04-03 19:02:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44742887/article/details/123942183

版权

细粒度专栏收录该内容

6 篇文章 0 订阅

订阅专栏

目录

MMAL-Net多分支多尺度

注意力目标定位模块（AOLM）

注意力局部提议模块（APPM）

MMAL-Net多分支多尺度

对比RA-CNN

1参数是用不同尺度图像训练的所以可以分类不同尺度图像。the parameters of CNN and FC in our three branches are shared. Therefore, through the common learning process of the three branches, the trained model has a good classification ability for different scales and parts of object.

2不需要计算多个局部区域图像的特征向量然后concat。the best classification performance is simply obtained by the result of object branch。

注意力目标定位模块（AOLM）

类似SCDA，但是使用的Resnet50。

这里把求和后的特征图F叫激活图A

1ResNet50预训练模型SCDA没法达到和VGG16预训练模型相似的精度。所以作者用训练集训练 ResNet-50，提升目标定位精度【指的应该就是第二个分支】。

2 相应这也换了层求交集。

注意力局部提议模块（APPM）

激活图上高激活值的区域通常是定位的关键部分

全卷积网络实现传统的滑动窗方法，从上一个分支的特征图输出中得到不同窗口的特征图

计算窗口激活均值代表窗口信息量进行排序（这里难道不就是个全局平局池化吗？）

降低区域冗余，NMS选择尺度不同的固定个数的窗口作为局部图像

非极大值抑制NMS：https://blog.csdn.net/shuzfan/article/details/52711706

排序后的、不同重要程度的局部区域

代码https://github.com/ZF4444/MMAL-Net

大坡山小霸王

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。