一、fast rcnn框架流程
1.输入:图像+RoIs(region of interest)到完全卷积网络(ConvNet) 输出:feature map
2.经过RoI pooling layer,每个RoI被池化到固定大小的feature map
3经过FCs(fully connected,fc)映射为一个feature vector
4.每个RoI在网络有两个输出向量:softmax probabilitie+per-class bbox regression(bbox regression是用来对窗口进行微调)
二、总结
1.优点:
2.缺点:(1)更高的检测质量(mAP)
(2)通过使用多任务损失(Multi-task loss),使得训练是单阶段的
(3)训练可以更新所有网络层
(4)对于特征缓存不需要磁盘存储
(5)提供了在caffe的框架下,如何定义自己的层/参数/结构的范例
training and testing end-to-end,ROIPooling层,使得训练效果提升不少
速度上的提升
3.分析: