Detection：faster rcnn

最新推荐文章于 2021-10-27 22:59:18 发布

plane0654

最新推荐文章于 2021-10-27 22:59:18 发布

阅读量537

点赞数

分类专栏： deep learning 文章标签： deep learning

本文链接：https://blog.csdn.net/byplane/article/details/71479640

版权

deep learning 专栏收录该内容

17 篇文章 0 订阅

订阅专栏

从ssd看过来。

fast rcnn主要解决了proposal之间的特征共享，原先selective search在图像上产生的2000个proposal要分别输入分类网络里过一遍，不可避免的产生了巨大计算资源浪费。在fast rcnn中利用reception field，先将整个图片过网络，得到fm后不同proposal对应到fm上就得到各自的特征。这样计算瓶颈就到了selective search上，faster rcnn主要解决了这个问题，利用rpn网络代替selective search。

RPN网络

region proposal network，作用是代替selective search产生proposal。在base net（比如vgg16）的最后一层的fm上选取n*n大小patch（文章里n=3），做3*3卷积变成一个12维列向量（512个fm），再分别过两个个1*1卷积层，一个产生2k个score（有物体或者背景），一个产生4k个坐标偏移来对应anchor，k是每个点上anchor的数量（为9）。

anchor

（1）vgg最后fm上每个点都对应9个anchor，这里并不是严格按照reception field对应。也就是总共有w*h*k个anchor。

（2）选取9个anchor，是为了多尺度。传统做多尺度是把原图或者filter做多尺度，对于cnn来说带来的计算负担是不可接受的。所以这里取巧了对anchor做了多尺度，现在也已经有多尺度的相关工作（Feature Pyramid Networks for Object Detection）。

损失函数

图片

其中normalization不是必要的且可以调整，最终结果对于 lan的变化不敏感。

训练方法

文章中用了四步。首先用pre-trained vgg训练rpn网络，其次用rpn的proposal训练fast rcnn，第三用fast rcnn fine-tune的网络训练rpn，这样两者可以共享权值，最后固定卷积层finetune fast rcnn特有层。

代码里给出的是approximate joint training，就是rpn和fast rcnn一起更新，但是rpn的梯度传不到前面卷积层，这样相当于做了一次近似。non-approximate joint training用roi-warping层将rpn的梯度传到前面，但是没给出代码。

plane0654

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Detection：faster rcnn

从ssd看过来。fast rcnn主要解决了proposal之间的特征共享，原先selective search在图像上产生的2000个proposal要分别输入分类网络里过一遍，不可避免的产生了巨大计算资源浪费。在fast rcnn中利用reception field，先将整个图片过网络，得到fm后不同proposal对应到fm上就得到各自的特征。这样计算瓶颈就到了selective sea
复制链接

扫一扫

专栏目录