⭐ R-CNN
参考文献:《Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation(2014)》
R-CNN算法全名为区域卷积神经网络,遵循传统目标检测算法的流程,将整个任务分为:候选区域生成、CNN网络提取区域特征、分类、预测框回归四个部分。
✔️诞生背景
传统视觉特征SIFT和HOG用于检测系统,性能提升缓慢;CNN用于分类效果好,能否提升检测性能?传统方法在图片上穷举候选区域,太慢。
✔️网络结构
- 生成候选区模块:SS(selective search),利用边缘、纹理、色彩变化等信息生成2000个候选区域。每个区域可能有1个物体,与类别无关。
- 提取特征的CNN模块:骨架是AlexNet用ImageNet预训练,将候选区缩放大小后(227×227)送入网络提取特征,将FC输出的1000改为N(检测类别)+1(背景),进行fine-tune。