本次汇报内容
1、论文 《Fast R-CNN》Microsoft Research 2015年 /
2、前述 《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 》空间金字塔池化网络,何恺明 2014年
前述RNN;
3、计划:
1)《Think Python》;
2)《Java 核心技术 卷I》
《Fast R-CNN》Microsoft Research
Fast Region-based Convolutional Network 快速的基于区域的卷积网络
概要:
Fast R-CNN以之前的工作为基础,利用深度卷积网络对项目提案进行有效分类,Fast R-CNN对VGG16网络进行了9倍于R-CNN的训练,在测试时的速度是213倍,并在PASCAL VOC 2012上实现了更高的mAP(检测质量)。与SPPnet金字塔网络相比,Fast R-CNN训练VGG16 3倍快,测试10倍快。
问题:R-CNN,候选窗口的特征是借助深度神经网络进行抽取的,在VOC和ImageNet数据集上都表现出了出色的检测精度。但R-CNN的特征计算十分耗时,因为它对每张图片中的上千个变形后的区域的像素反复调用CNN,SPPnet只需要在整张图片上