Fast RCNN是在RCNN的基础上进行的改进,整体的算法思路是一样的,改进之处如以下几点:
- 引入ROI pooling层,第一避免resize特征图到224*224,由于ROI pooling是可导的,所以实现了端到端的学习;
- CNN网络提前做了预训练,初始化权重是进过ImageNet数据集的训练得到,大大提高网络效率;
- 采用了多任务损失函数,一个任务是用softmax进行分类,另一个任务是边界框回归;
- 利用截断的奇异值分解加速网络。
Fast RCNN的总体框架图:
便于理解,借鉴了一个其他人的图: