Fast R-CNN
Key Knowledgeable:
-
ROI Pooling:使用Max Pooling将不同ROI的特征转换为相同维度的特征向量。
-
Multi-task Loss Function:
3.使用Fast R-CNN对网络进行的修改:
- 用RoI pooling layer取代网络的最后一个池化层;
- 最后一个FC层和softmax替换成Fast R-CNN框架图介绍的两个FC层;
- 输入两组数据到网络:一组图片和每一个图片的一组RoIs;
Contributions:
- Higher detection quality and Faster
- Achieve single-stage by using a multi-task loss, Training can update all network layers(almost end to end)
Contrast vs R-CNN:
- R-CNN训练空间大:训练92个SVM需要将做region proposal回归提取的特征全部保存,而Fast R-CNN不需要额外保存特征。
- R-CNN测试慢:R-CNN需要用CNN对2k个region proposals都做特征提取,一个region proposal做需要92个SVM逐一进行分类。而Fast R-CNN是图像直接得到特征图后对每一个region proposal进行Pooling直接得到对应的特征向量,同时分类一个RoI也是只需要一次FC。
- 几乎实现end to end:R-CNN是 multi-stage pipeline。而Fast R-CNN除了region proposals的输入部分是需要SS提前处理,其他通过两个FC之后各自的SoftMax与bounding box regression来实现分类与候选框回归。