图像目标检测网络

北落师门XY

于 2019-10-14 22:43:39 发布

阅读量1.2k

点赞数

分类专栏： ML、DL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41819299/article/details/100529230

版权

本文深入探讨了目标检测网络的发展，从RCNN到Faster R-CNN，再到SSD和YOLO。RCNN利用选择性搜索获取候选区域，Fast R-CNN优化了计算流程，Faster R-CNN引入RPN网络替代SS，而YOLO则采用直接回归方法进行目标检测。文章详细解释了ROI池化、Anchor Boxes等关键概念，并介绍了SSD和YOLO的优化策略，如多尺度特征和快速分类。

摘要由CSDN通过智能技术生成

主要有两大流派：

候选框（先获取主体所在候选区域，后分类，又称two-stage技术）：RCNN系列、SPP、R-FCN

回归法(直接进行BBox回归与主体分类)：YOLO、SSD

一、定义

ROI（region of interest）：感兴趣区域

region proposal method：候选区域方法

RPN（region proposal network）：候选区域网络

滑动窗口检测

SS（selective search）：选择性搜索

fpn（feature pyramid networks）：特征金字塔网络

二、RCNN（SS替代滑动滑窗）

用候选区域方法替代滑动窗口，更快更准。CNN classifier用于获取4096个特征，SVM用于确定box的类别，regressor边界框回归器/线性回归器/全连接层用于提炼边界框。

例如下图就是利用像素增长（基于像素纹理）获得的区域，与其对应的感兴趣区域（ROI），将这些ROI昨晚候选区域，进行选择性搜索。总的来说RCNN就是利用了传统算法获取候选区域，再利用CNN提取特征，进行分类回归。是一种传统+深度的方法。

三、fast RCNN（CNN放在SS前）

ROI有重叠的可能，将ROI放到CNN classifier中时，就有重复计算的问题，由此将CNN这一步放到前面，先获取CNN，再计算ROI（例如利用VGG的conv5来计算ROI），再裁减特征图。

img——CNN获取Feature map——计算ROI——裁取——ROI池化——FC算class及回归box

采用的损失有：分类损失、定位损失

四、ROI池化

ROI池化=ROI+最大池化

对Feature map取感兴趣区域，若为2*2目标，将ROI区域划分为相等或相似大小的2*2个区域，每个区域取最大值

五、Faster R-CNN（RPN网络替代SS）

参考链接：https://blog.csdn.net/liuxiaoheng1992/article/details/81843363

用候选区域网络（RPN）代替候选区域方法（不用SS）生成ROI，简单理解就是用深度网络的方法代替了融合像素的方法。

<

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
图像目标检测网络

一、定义ROI（region of interest）：感兴趣区域region proposal method：候选区域方法RPN（region proposal network）：候选区域网络滑动窗口检测SS（selective search）：选择性搜索二、RCNN用候选区域方法替代滑动窗口，更快更准。CNN classifier用于获取4096个特征，SVM用于确...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。