faster r-cnn features for instance search-笔记

最新推荐文章于 2022-06-08 01:14:39 发布

YiLiang_

最新推荐文章于 2022-06-08 01:14:39 发布

阅读量1.3k

点赞数

分类专栏： image retrieval deep learning object detection 文章标签：图像检索目标检测

deep learning 同时被 3 个专栏收录

40 篇文章 0 订阅

订阅专栏

object detection

10 篇文章 0 订阅

订阅专栏

image retrieval

5 篇文章 0 订阅

订阅专栏

1.整个网络结构

整个网络从总体上看是faster-rcnn的网络结构，上面一部分是faster-rcnn 的RPN net部分，RPN net的输出rpn proposals，网络的下面部分

是ROI pooling 加上三个全连接层，输出是class probabilities.

Image-wise pooling of activations(IPA): 这一步骤实际上抽出image的representation，具体的方法是从卷积层的最后一层

conv5_3(针对VGG16 Net，并且经过了reLu层之后），然后做pooling，具体pooling 的方法作者是借鉴另外一篇paper：《particular object retrieval

with integeral max-pooling of CNN activations》。举个例子来说：如果最后conv5_3得出的feature map的维度是K*W*H,其中K为卷积核的数目，W*H

为每一个卷积核卷积之后的feature map，这样对于每一个W*H的feature Map 采用max-pooling 或者sum-pooling 就能得到一个值。这样，整个K*W*H

采用pooling之后得到的feature即为K*1的向量。

Region-wise pooling of activations(RPA): 这一步骤得到的是region的representation,有了上面的IPA，这一步的RPA也很容易理解，

就是找出region proposals 的ROI pooling，在ROI pooling层上面做max-pooling。

2.fine-tuning faster rcnn

fine tuning 采用两种方式：

strategy1: fine tuning ROI pooling之后的三层网络。

strategy2:fine tuning network after conv_2

fine-tuining 所使用图像为query 图像以及将其做horizontal flip之后的图像（个人感觉图像好少）。

3.Image Retrieval

一共分为三个步骤：

1.过滤：提取出查询图像以及数据库图像的IPA，然后通过计算余弦距离将数据库图像进行排序。（整个过程都是使用的图像的IPA与区域无关）。

2.空间重排：

空间重排采用了两种方法：

Class-Agnostic Spatial Reranking (CA-SR):假设类别不可知，计算每一个query bounding box的RPA与采用第一部过滤前N幅图像每一个proposal的

余弦距离，最高的作为query与图像的余弦距离。

Class-Specific Spatial Reranking(CS-SR):使用和query相同的instances 来fine-tuin过后的整个网络，然后使用FC-8之后的class-probality 的类别得分

将其作为query与proposal 的得分。

3.查询扩展：最简单的查询扩展的方法。

4.实验

1.对比IPA以及RPA采用sumpooling 以及 maxpooling的好坏。最终得出IPA使用sumPooling RPA使用maxPooling

2.使用fine-tuin、重排、查询扩展的结果图：

作者得出的结论是是使用第二种fine-tuin的方式能够使查询结果得到很大提高。

和stat-of-art方法的比较：

作者的conclusion：

1.suitable to obtain image and region features in a single forward pass.

2.Fine tuining as an effective solution to boost retrieval performance (subject to application time constrains)

5.细节：

1.Image-wise pooling of activations (IPA)

就是用最后一层卷积层的激活值来构建对整幅图片的描述。

2.Region-wise pooling of activations (RPA)

RPN产生的proposals的卷积特征求和池化特征先用L2归一化，whitening后再L2归一化一次，而最大池化特征只进行一次L2归一化。

3.微调faster-rcnn

两种：只调整全连接层和除前两层卷积层外都所有层都微调

4.Class-Agnostic Spatial Reranking (CA-SR)

未知类别空间排序

5.Class-Specific Spatial Reranking (CS-SR)

特定类别排序，使用相同检索物体微调后的网络，可以直接使用RPN proposal的得分来作为与待检索物体的相似度得分，

得分用来对图片列表进行排序。

6.数据集

在Oxford和Pairs数据集里，输出12种类别可能（11种建筑+背景）。

在INS 13中有30种不同的检索实例，输出31种类别可能。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
faster r-cnn features for instance search-笔记

1.整个网络结构整个网络从总体上看是faster-rcnn的网络结构，上面一部分是faster-rcnn 的RPN net部分，RPN net的输出rpn proposals，网络的下面部分是ROI pooling 加上三个全连接层，输出是class probabilities. Image-wise pooling of activations
复制链接

扫一扫

专栏目录

YiLiang_ CSDN认证博客专家 CSDN认证企业博客

码龄8年

48: 原创

22万+: 周排名

98万+: 总排名

26万+: 访问

: 等级

2958: 积分

97: 粉丝

81: 获赞

28: 评论

134: 收藏

私信

关注

热门文章

分类专栏

最新评论

Linux提示 /usr/bin/ld:cannot find-lxxx 系列解决方法
黄思博呀: 求解，/usr/lib下已经建立软连接，但重新编译还是报/usr/bin/ld can't found -lxx.（我啷个晓得嘛）
Linux提示 /usr/bin/ld:cannot find-lxxx 系列解决方法
gwbswer: -config --libs opencv` -L/usr/local/cuda-11.3/lib64 -lcuda -lcudart -lcublas -lcurand -lstdc++ /usr/bin/ld: 找不到 -lcudart /usr/bin/ld: 找不到 -lcublas /usr/bin/ld: 找不到 -lcurand collect2: error: ld returned 1 exit status make: *** [Makefile:177：darknet] 错误 1 这咋办呐
caffe学习笔记31-理解全连接层
qq_46511579: 卷积核与滤波器不是一个东西.滤波器由卷积核构成。例如输入RGB图像，则需要3个卷积核。这3个卷积核就构成了滤波器
Linux提示 /usr/bin/ld:cannot find-lxxx 系列解决方法
weixin_43288910 回复 jaffe—fly: 你好，可以举例细说一下吗，搜的方法都没解决这个问题
make: ***No rule to make target 'include/layers/python_layer.hpp, needed by 'python/caffe/_caffe.so'
Davemissyou: 是home 目录下的.bashrc 文件吧

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。