R-CNN 理论笔记
算法流程
- 将一张图像生成1K~2K个候选区域(使用Selective Search方法)
- 对每个候选区,使用深度网络提取特征
- 特征送入每一类的SVM分类器,判断是否属于该类
- 使用回归器精细修正候选框位置。
1.
Selective Search算法得到一系列矩形框,假设有2K个
2.
将2K个候选区域缩放到227227,接着输入到AlexNet CNN,得到2K$$4096的特征矩阵。
3.
假设有20个类,那么得到的2000*4096的特征与4096*20的SVM权值矩阵相乘,得到2000*20的概率矩阵。
2000代表2000个候选框,每个候选框有20个概率值,代表该候选框属于该类的概率
此处还需对2000*20的每一列进行非极大值抑制剔除重复建议框。
4.
将建议框与GT目标框坐标对建议框进行微调。
R-CNN存在的问题
- 测试速度慢
- 训练速度慢
- 训练所需空间大