two-stage与one-stage目标检测算法概览

最新推荐文章于 2024-06-03 01:33:31 发布

eternity1118_

最新推荐文章于 2024-06-03 01:33:31 发布

阅读量4k

点赞数 2

分类专栏： DL Computer Vision # 目标检测文章标签：目标检测 one-stage two-stage

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eternity1118_/article/details/89476028

版权

Computer Vision 同时被 3 个专栏收录

83 篇文章 17 订阅

订阅专栏

25 篇文章 0 订阅

订阅专栏

7 篇文章 3 订阅

订阅专栏

two-stage检测算法

1、特点

1）主干网络为CNN，提取卷积特征；
2）最早由rgb提出，典型代表为R-CNN；
3）是一种端到端的目标检测算法（基于RPN网络）；
4）准确度高，速度相对one-stage慢；

2、检测流程

在这里插入图片描述
简单来说，就是首先产生候选区域，然后提取CNN特征，再进行区域分类和位置精修。

3、常见算法

代表算法有：R-CNN，Fast R-CNN，Faster R-CNN，以及各种变体。

这里，我截了一张图，可以很清晰的看到它的各种变体算法：

在这里插入图片描述

4、核心组件

核心组件就是主干网络CNN，加RPN网络，关于CNN网络要遵循以下几个原则：

1）尽量去繁从简；
2）多尺度特征融合；
3）模型尽量轻量化；

再来说下RPN网络吧。

在这里插入图片描述
1）区域推荐

采用anchor机制，看下图；
在这里插入图片描述
以每个feature map的每一个像素为中心（叫做锚点），按照不同比例提取候选区域，以Fast R-CNN为例，会采用9个不同的尺度，所以最后会提取到wxhx9个候选区域；
然后利用GT来对这些候选区域进行筛选，得到正样本和负样本，这里要注意GT和候选区域的size；
具体的后面博客更新会专门讲到，今天只是概览。

2）ROI Pooling

ROI Pooling属于RPN网络的一个layer，它的输入有3部分，分别为：feature map、ROIs（1x5x1x1，这里的5指的是x，y，w，h，idx，idx索引是为了将x，y，w，h指定的ROI信息映射到feature map，因为可能会有多个ROI映射到同一个feature map）、ROI参数（缩放尺度参数等）；输出则是固定尺寸的feature map；

总结的说，ROI Pooling的作用其实就是完成了抠图加resize的操作。

3）分类和回归

这部分不再介绍；

5、two-stage的改进方向

1）寻求更好的网络特征；
2）寻求更好的RPN网络；
3）更完善的ROI分类；
4）样本后处理；
5）更大的mini-batch

one-stage检测算法

1、特点

1）使用CNN卷积作为特征提取；
2）无需region proposal，直接回归目标物体的类别概率和位置坐标；
3）准确度低，但速度快；

2、常见算法

1）YOLO V1、YOLO V2、YOLO V3
2）SSD及变体
3）RetinaNet等

4、核心组件

one-stage检测算法的核心组件是CNN主干网络+回归网络；
不再细说，前面讲过SSD的原理，可以参考；

one-stage和two-stage算法对比

one-stage的优缺点：
优点：速度快、能够学到物体的泛化特征、避免背景错误产生false positive；
缺点：准确度低、对小目标检测效果不佳；

two-stage的优缺点：
优点：准确度高、anchor机制、共享计算量；
缺点：速度慢、训练时间长；

总结：一般来说，在终端产品会选择one-stage，云端会偏向选择two-stage。

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
two-stage与one-stage目标检测算法概览

two-stage检测算法1、特点1）主干网络为CNN，提取卷积特征；2）最早由rgb提出，典型代表为R-CNN；3）是一种端到端的目标检测算法（基于RPN网络）；4）准确度高，速度相对one-stage慢；2、检测流程简单来说，就是首先产生候选区域，然后提取CNN特征，再进行区域分类和位置精修。3、常见算法代表算法有：R-CNN，Fast R-CNN，Faster R-CNN...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。