RACNN笔记

最新推荐文章于 2023-06-23 18:25:34 发布

JianqiuChen

最新推荐文章于 2023-06-23 18:25:34 发布

阅读量531

点赞数

分类专栏：细颗粒检测文章标签：人工智能深度学习

本文链接：https://blog.csdn.net/JianqiuChen/article/details/105464883

版权

细颗粒检测专栏收录该内容

3 篇文章 0 订阅

订阅专栏

RA-CNN是一种在细粒度图像识别中实现高精度而无需边界框标注的深度学习算法。它包含多个独立的子网络，每个子网络针对不同尺度，包含分类网络和注意力定位网络（APN）。通过rank损失函数逐步提高各层的准确性，使用多线性插值放大图像进行裁剪。训练过程采用交叉训练策略，交替更新VGG分类网络和APN层的权重，以优化分类和候选框的位置。

摘要由CSDN通过智能技术生成

Recurrent attention convolutional neural network for fine-grained image recognition 中的RA-CNN算法不需要对数据做类似bounding box的标注就能取得和采用类似bounding box标注的算法效果。有多个结构相同参数不共享的子网络对应每个scale。每个子网络包含分类网络和APN网络。对两个网络进行教程训练。用APN网络取代了之前的bbox。通过rank 损失函数使得每一层的准确率逐步提升。

在这里插入图片描述
每一层将上一层的图像放大到裁剪前的大小。

训练过程

先将图像送入VGG网络提取特征，得到的feature map，比如说1414256，然后接一个全连接层，变成111024，然后再接一个全连接层，变成113。3是正方形的坐标包括，左上角的xy,以及框长l。然后把这个框再放大为224*224后，送入级联网络的下一层。放大的时候是用多线性插值的，这样得到的图更细致。
在这里插入图片描述
tx ty 是关于x，y的中心点 l是这个正方形的长度的一半

裁剪的计算方法（有利于反向传播）在这里插入图片描述
损失函数

前一项是分类的损失函数，后一项是候选框的损失函数

后面的候选的损失函数
在这里插入图片描述
Pt是分类正确的概率，目的是下一层网络分类正确概率大于上一层网络得到的分类正确概率。

向着响应方向更新正方形的中心在这里插入图片描述
训练方式：
交叉训练：设置学习率来达到交替训练的，一段时间内，APN层的学习率为0，训练VGG分类网络；一段时间内，VGG分类网络的学习率为0，训练APN层。

引用：
https://zhuanlan.zhihu.com/p/36395581

JianqiuChen

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RACNN笔记

Recurrent attention convolutional neural network for fine-grained image recognition 中的RA-CNN算法不需要对数据做类似bounding box的标注就能取得和采用类似bounding box标注的算法效果。有多个结构相同参数不共享的子网络对应每个scale。每个子网络包含分类网络和APN网络。对两个网络进行教程...
复制链接

扫一扫

专栏目录