RCNN区域卷积神经网络
前言
在经历了一段时间的胡碰乱撞之后,对基于深度学习的目标检测有了初步的认识,决定开始系统地学习目标检测算法,品读论文,研究算法,编程实现。作为小白,还是从早期经典的RCNN开始入手。
RCNN详解
1.摘要
RCNN(region with CNN features),区域卷积神经网络。主要有以下两个创新点:
(1) 通过图像分割和选择搜索(selective search)得到候选框(region proposal),然后在候选框上使用CNN提取特征,用于定位和识别物体。
(2) 当带标签的训练数据不足时,对辅助任务的大训练集进行有监督训练,然后在小数据集上进行微调(fine-tune)。
2.训练过程
(1) 预训练卷积网络
- 在ILSVRC2013训练集上图片resize到227x227,有监督预训练alexnet。
(2) 卷积网络参数微调
- 首先,根据特定任务修改alexnet最后几层结构。
- 在小数据集中,对每张图片通过选择搜索得到的约2000个候选框,与groundt