Faster R-CNN、Fast R-CNN、SSD、YOLO区别

最新推荐文章于 2024-06-16 18:02:18 发布

今晚打老虎

最新推荐文章于 2024-06-16 18:02:18 发布

阅读量7.8k

点赞数 5

分类专栏：面试之CV基础知识深度学习点滴

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_24502469/article/details/105121275

版权

深度学习点滴同时被 2 个专栏收录

43 篇文章 3 订阅

订阅专栏

面试之CV基础知识

31 篇文章 9 订阅

订阅专栏

R-CNN：

过程：

先用Selective Search提取候选框
然后将候选框强制到227*227
之后用AlexNet提取特征
最后将特征用SVM分类

优点：

相对于传统方法用HOG或者SITF提取特征，本文用CNN来提取特征

缺点：

两千多个候选框分别送入CNN提特征，时间消耗大
三个阶段分开训练，中间数据还要保存，空间消耗大

Fast R-CNN：

过程：

将整张图送入CNN提取特征图
用Selective Search提取候选框，并在映射到特征图上
借鉴SPP的思想，用ROI pooling将不同尺度的FM转换成固定尺度的特征
用FC做分类和回归

优点：

相对于R-CNN，用softmax取代SVM做分类，提出多任务loss
用ROI pooling将不同尺度的ROI得到固定尺度的输出

缺点：

用SS提取候选框耗时

Faster R-CNN

过程：

对整张图送入CNN提取FM
在FM上使用RPN，在每个像素点设置9个anchor，并用softmax筛选正负anchor
然后对筛选的anchor做回归分类

优点：

提出RPN网络和anchor机制，解决了SS的问题

缺点：

Two-stage仍然无法达到实时

YoloV1：

优点：

相对于R-CNN使用候选框，yolo直接把目标检测看作是回归问题，在CNN里对整张图直接做回归和分类。
将CNN提取的FM划分为S*S个网格（7*7），每个网格预测B个bbox的位置（x、y、w、h）、置信度（confidence为交并比）、类别概率。

缺点：

输入尺度固定，不能处理多尺度输入
每个像素点预测两个box，检测目标过少
多次下采样特征损失
虽然速度快，但识别率不高

YoloV2：

检测类别数从20到9000
使用BN，避免梯度消失，加速收敛
用高分辨率图像训练分类网络
借鉴RPN的anchor boxes，有先验知识，预测更快
用k-mean聚类算法，让模型自动选择更合适的先验框长、宽
将预测的偏移量限制在一个网格范围内，模型更稳定
网格为每个bbox预测5个偏移量：tx,ty,tw,th,to
提出passthrough层，有利于小目标检测
多尺度输入图像进行训练

YoloV3：

YOLO3采用了称之为Darknet-53的网络结构（含有53个卷积层），它借鉴了残差网络residual network的做法，在一些层之间设置了快捷链路
采用了3个不同尺度的特征图来进行对象检测
9种尺度的先验框

SSD：

在CNN中六层不同尺度的FM上生成anchor，然后将anchor结合做NMS

优点：

结合Yolo和Faster R-CNN更快更准，大尺度FM检测小目标，小尺度FM检测大目标

缺点：

对小目标检测仍然不好

今晚打老虎

关注

5
点赞
踩
36

收藏

觉得还不错? 一键收藏
1
评论
Faster R-CNN、Fast R-CNN、SSD、YOLO区别

R-CNN：过程：先用Selective Search提取候选框然后将候选框强制到227*227 之后用AlexNet提取特征最后将特征用SVM分类优点：相对于传统方法用HOG或者SITF提取特征，本文用CNN来提取特征缺点：两千多个候选框分别送入CNN提特征，时间消耗大三个阶段分开训练，中间数据还要保存，空间消耗大Fast R-CNN：过程：...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。