[深度学习入门]两阶段目标检测算法到Faster RCNN

最新推荐文章于 2024-10-09 17:24:52 发布

Guycynnnnn

最新推荐文章于 2024-10-09 17:24:52 发布

阅读量2.6k

点赞数

分类专栏：深度学习文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Guycynnnnn/article/details/123719344

版权

本文介绍了深度学习在目标检测中的应用，特别是两阶段目标检测算法Faster R-CNN的发展。从RCNN、SPP-Net到Fast R-CNN，最终到Faster R-CNN，探讨了候选框提取、ROI Pooling和特征融合等关键技术，强调了Faster R-CNN的端到端特性以及在VGG和FPN基础上的改进。

摘要由CSDN通过智能技术生成

目标检测

一、两阶段法

1、概述：

计算机视觉：

三大热点方向：计算机视觉、自然语言处理、语音识别
四类任务：图像分类(label)、目标检测(what+where)、图像语义分割(what+where)、图像实例分割(what+where)
目标检测：位置+类别
问题：尺寸范围大，物体角度、姿态不定，可以出现在图片任何地方，多类别

数据集：

PASCAL VOC(VOC2007/VOC2012)
MS COCO(MSCOCO2014/MSCOCO2017 训练集：118287/验证集：5000)
Object365密集标注（63W）

2、传统目标检测：

人工设计特征，机器根据人工设计的特征检测（更关注单类别）

（1）基于滑动窗的目标检测
困难：计算量大、很难基于特定的特征去适应多类别

（2）VJ Detector：实时目标检测（人脸）
将图像表示为积分图像，eg: 人脸明暗变化
使用Adaboost，构建多个弱分类器
采用Cascade级联多个强分类器，快速过滤大量不相关窗口

（3）HoG 行人检测
使用物体检测特征描述子，在人脸检测上有效

（4）DPM：
基于HoG行人检测衍生出来的，基于组件的检测特征及算法网络，在HoG特征的基础上提取了更具辨识力的特征

传统目标检测的问题：

人工特征设计局限性
计算复杂
后面依赖分类器

3、两阶段目标检测：

**（1）深度学习下的目标检测：**图像->网络->输出类别、框

边界框回归：通过学习一种映射关系，对目标候选的位置进行精化
IOU（交并比）：用来衡量真实标注和预测结果的重合程度
NMS（非极大值抑制）：消除冗余的检测框

两阶段法：判断有无目标后回归，后将目标分类后回归
一阶段法：直接对框判断分类，同时对位置进行回归

（2）两阶段法
1）RCNN

提取候选框：
方法：Selective Serach选择性搜索：根据相似度融合的方法

问题：
每张图需要额外步骤提取region proposal候选框
存储和重复提取每个region proposal的特征花费大量存储和计算资源

特征提取：
方法：CNN
问题：保存所有数据候选区域的特征，浪费资源
区域分类
方法：为每一个类训练SVM分类器
问题：每个SVM需要单独训练，网络复杂、空间消耗大
边界框回归
方法：最小二乘法线性回归（输入：特征、真是位置；输出：修正位置）
问题：比较笨？？？

2）SPP-Net

不再对每个候选区做扭曲
不再对每个候选区提取CNN特征
直接提取整个图像特征，将图像的扭曲变成特征上的变化

作用：减少了提取特征的时间和用来存储特征的空间
做法：空间金字塔池化

特征划分成多个固定网

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。