1. Fast R-CNN
R-CNN需要很多候选区域以提高准确度,但是很多候选区域其实是彼此重叠的,如果我们有2000个候选区域,每一个候选区域都需要独立的送到CNN中,对于不同的ROI,我们需要提取2000次特征,效率很低。CNN的特征图是以一种密集的方式表征空间特征,我们可以直接使用特征图来代替原图来检测目标。
不同于R-CNN多次对每个图像提取特征,Fast R-CNN使用特征提取器(CNN)先提取整个图像的特征,然后将创建候选区域的方法直接应用到特征图中。
例如,Fast R-CNN 选择了 VGG16 中的卷积层 conv5 来生成 ROI,这些关注区域随后会结合对应的特征图以裁剪为特征图块,并用于目标检测任务中。我们使用 ROI 池化将特征图块转换为固定的大小,并馈送到全连接层进行分类和定位。因为 Fast-RCNN 不会重复提取特征,因此它能显著地减少处理时间。
以下是Fast