深度学习中目标检测的原理概述–发展历史
前言:图像的目标检测经历了几个不同的阶段,使用的方法不断改善并且效果不断优化
阶段一传统的目标检测方法
传统的目标检测方法大多以图像识别为基础。一般通过四个步骤
来完成;步骤一、在图片上使用穷举发选出所有物体可能出现的区域框。步骤二、对这些区域框提取特征。步骤三、使用图像识别方法对特征进行分类。步骤四、通过非极大值抑制输出结果
改善传统目标检测的方法,阶段二R-CNN
步骤一、不使用穷举法,改用Selective Search
搜寻可能存在物体的区域。步骤二、将大小不同的区域框缩放为统一大小,改用CNN-AleNet网络
对区域框提取特征。步骤三、使用SVM对特征进行分类。步骤四、通过非极大值抑制输出结果。
改善R-CNN的方法,阶段三SPPNet
步骤一、使用Selective Search搜寻可能存在物体的区域。步骤二,先对整体图像进行一遍卷积计算,得到整个图像的卷积特征;
接着对于原始图像中的各种候选框在卷积特征中找到对应的位置框,再使用ROI池化层对位置框中的卷积提取特征。步骤三、使用SVM对特征进行分类。步骤四、通过非极大值抑制输出结果。
改善SPPNet的方法,阶段四Fast R-CNN
步骤一、使用Selective Search搜寻可能存在物体的区域。步骤二,先对整体图像进行一遍卷积计算,得到整个图像的卷积特征;接着对于原始图像中的各种候选框在卷积特征中找到对应的位置框,再使用ROI池化层对位置框中的卷积提取特征。步骤三、使用FC-Softmax神经网络分类器进行分类
。步骤四、通过非极大值抑制输出结果。
改善Fast R-CNN的方法,阶段五Faster R-CNN
步骤一、使用RPN网络
替代Selective Search搜寻可能存在物体的区域。步骤二,先对整体图像进行一遍卷积计算,得到整个图像的卷积特征;接着对于原始图像中的各种候选框在卷积特征中找到对应的位置框,再使用ROI池化层对位置框中的卷积提取特征。步骤三、使用FC-Softmax神经网络分类器进行分类。步骤四、通过非极大值抑制输出结果。