前言
两阶段目标检测
两阶段目标检测的演进历程如下:
首先是RCNN:使用selective search进行区域提取,然后将提取的区域resize到固定尺寸,接着通过卷积神经网络(CNN)提取特征,并使用支持向量机(SVM)进行分类(每个区域的分类都需要独立的CNN,速度较慢)。
接着是SPP Net:同样使用selective search进行区域提取,然后通过CNN提取特征,但是引入了空间金字塔池化(SPP),使得不同尺度的特征可以被有效地利用,最后再通过SVM进行分类。
然后是Fast RCNN:同样使用selective search进行区域提取,但是引入了区域兴趣池化(ROI Pooling),使得不同大小的区域可以被CNN共享,从而提高了速度。
接下来是Faster RCNN:引入了区域生成网络(RPN),用于在特征图中提取候选区域,然后再通过ROI Pooling和共享的CNN提取特征。
最后是Mask RCNN:在Faster RCNN的基础上,引入了更高质量的特征提取方式(ROI Align),以及特征金字塔网络(FPN),同时实现了目标检测和实例分割。
一阶段目标检测