RACNN笔记

RA-CNN是一种在细粒度图像识别中实现高精度而无需边界框标注的深度学习算法。它包含多个独立的子网络,每个子网络针对不同尺度,包含分类网络和注意力定位网络(APN)。通过rank损失函数逐步提高各层的准确性,使用多线性插值放大图像进行裁剪。训练过程采用交叉训练策略,交替更新VGG分类网络和APN层的权重,以优化分类和候选框的位置。
摘要由CSDN通过智能技术生成

Recurrent attention convolutional neural network for fine-grained image recognition 中的RA-CNN算法不需要对数据做类似bounding box的标注就能取得和采用类似bounding box标注的算法效果。有多个结构相同参数不共享的子网络对应每个scale。每个子网络包含分类网络和APN网络。对两个网络进行教程训练。 用APN网络取代了之前的bbox。通过rank 损失函数使得每一层的准确率逐步提升。

在这里插入图片描述
每一层将上一层的图像放大到裁剪前的大小。

训练过程

先将图像送入VGG网络提取特征,得到的feature map,比如说1414256,然后接一个全连接层,变成111024,然后再接一个全连接层,变成113。3是正方形的坐标包括,左上角 的xy,以及框长l。然后把这个框再放大为224*224后,送入级联网络的下一层。放大的时候是用多线性插值的,这样得到的图更细致。
在这里插入图片描述
tx ty 是关于x,y的中心点 l是这个正方形的长度的一半

裁剪的计算方法(有利于反向传播)在这里插入图片描述
损失函数
在这里插入图片描述
前一项是分类的损失函数,后一项是候选框的损失函数

后面的候选的损失函数
在这里插入图片描述
Pt是分类正确的概率,目的是下一层网络分类正确概率大于上一层网络得到的分类正确概率。

向着响应方向更新正方形的中心在这里插入图片描述
训练方式:
交叉训练:设置学习率来达到交替训练的,一段时间内,APN层的学习率为0,训练VGG分类网络;一段时间内,VGG分类网络的学习率为0,训练APN层。

引用:
https://zhuanlan.zhihu.com/p/36395581

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值