Regional Attention Based Deep Feature for Image Retrieval
基于给attend 区域打分权重的一种方法。
文中贡献:
( 1)使用上下文以及R-MAC区域attention 模型。根据图像的上下文给出区域的权重分数。
模型结构
首先给出了一种可以抑制背景以及非重要区域的,然后根据上下文给出attention的方法。
实验中认为ResNet101配合R-MAC的效果是要好于VGG的。
其中文中的R-MAC将最后的sum pooling 变成了mean pooling 这样使得结果更加稳定。 但是对于大尺度的问题,R-MAC的表现会降低。
上下文区域attention
在介绍具体算法之前首先对一些变量进行描述
最终的输出结果是根据,region propasal的mean pooling,产生的vec来计算权重,然后使用求max pooling的权重均值。
还有一种基于上下文的global 均值权重
其中权重是根据,区域mean pooling以及J(v),
训练region wise attention
training region-wise attention . 训练区域attention network,
其中L表示全连接层。
计算交叉熵yI的,训练(wr, wc, br, bc)。
训练的时候固定住cnn卷积。