⭐ Fast RCNN
参考文献:《Fast R-CNN(2015)》
对R-CNN进行了改进提升,技术流程为:候选区域生成、CNN网络提取整图特征、ROI池化得到候选区域特征、同时完成分类+回归。
✔️诞生背景
R-CNN通过选择性搜索提出2000个候选区,每个区域都要进行CNN提特征+SVM分类,计算量大速度慢,且每个区域特征存到磁盘上空间消耗大;候选区大小不一,因FC的存在不得不resize固定尺寸造成图像失真(SPP-Net已解决前俩);CNN、SVM、边框回归器是分别训练的,没有融合成一个整体。
✔️网络结构
与R-CNN模块大致相同,相比R-CNN有一些改变。
- 生成候选区模块:SS(selective search),输入origin图片,利用边缘、纹理、色彩变化等信息生成2000个候选区域。每个区域可能有1个物体,与类别无关。
- 提取特征的CNN模块:骨架是VGG-16用ImageNet预训练,用卷积层和池化层处理