RCNN算法的核心思想就是对每个区域通过CNN提取特征,把对象检测转换成了一个图像分类问题。
基于区域的对象检测进化路线:RCNN ->SPPnet -> Fast-RCNN -> Faster-RCNN
一句话来描述 描述解决了的问题:
RCNN :可以用CNN做对象检测吗?
SPPnet :cnn网络可以只输入一张图片吗?
Fast-RCNN :可以把bounding box和分类都放在一个网络里吗?
Faster-RCNN :检测可以做到end-to-end,速度更快点吗?
RCNN摘要:
性能: 47秒/张图片,VOC2007上的检测结果是66%(mAP)
技术要点: selective search生成proposal,proposal归一化到227*227,CNN对图片的每个候选区域都要提取特征,分类采用SVM,然后对分类好的propossal进行回归
SPPnet摘要:
技术要点:对任意输入候选区域,在Feature Map上做金字塔pooling,对Map分为4*4,2*2,1*1三种网络,得到固定纬度(16 + 4 +1 = 21维)
Fast RCNN摘要:
性能:3秒/张图片,检测结果是70%(mAP)
技术要点:ROI pooling,类似SPP,但是金字塔只有一层 7*7的网络,损失函数使用多任务损失函数,将边框回归加入CNN网络
Faster RCNN摘要:
性能:200毫秒/张图片,检测结果是73.2%(mAP)
技术要点:使用RPN网络,加入9种anchors,输入的特征proposal接入到ROI pooling,检测变成end-to-end。
RCNN算法的核心思想就是对每个区域通过CNN提取特征,把对象检测转换成了一个图像分类问题。
基于区域的对象检测进化路线:RCNN ->SPPnet -> Fast-RCNN -> Faster-RCNN
一句话来描述 描述解决了的问题:
RCNN :可以用CNN做对象检测吗?
SPPnet :cnn网络可以只输入一张图片吗?
Fast-RCNN :可以把bounding box和分类都放在一个网络里吗?
Faster-RCNN :检测可以做到end-to-end,速度更快点吗?
RCNN摘要:
性能: 47秒/张图片,VOC2007上的检测结果是66%(mAP)
技术要点: selective search生成proposal,proposal归一化到227*227,CNN对图片的每个候选区域都要提取特征,分类采用SVM,然后对分类好的propossal进行回归
SPPnet摘要:
技术要点:对任意输入候选区域,在Feature Map上做金字塔pooling,对Map分为4*4,2*2,1*1三种网络,得到固定纬度(16 + 4 +1 = 21维)
Fast RCNN摘要:
性能:3秒/张图片,检测结果是70%(mAP)
技术要点:ROI pooling,类似SPP,但是金字塔只有一层 7*7的网络,损失函数使用多任务损失函数,将边框回归加入CNN网络
Faster RCNN摘要:
性能:200毫秒/张图片,检测结果是73.2%(mAP)
技术要点:使用RPN网络,加入9种anchors,输入的特征proposal接入到ROI pooling,检测变成end-to-end。