算法流程:
- 输入一张检测图片,提取1K到2K个候选区域;
- 对这些候选区域,利用深度神经网络进行特征提取;
- 神经网络提取特征利用SVM分类器,判断属于哪一个类别;
- 使用回归器修正每个候选框的位置。
每个步骤的详细解释:
-
生成候选区域
采用Selective Search的方法从一张图像生成约1000~2000张候选区域框。
Selective Search:
- 先利用分割将图片分割成小图;
- 利用一些合并规则,将小图均匀的合并;
- 合并若干次后,直到拼成整张原图;
- 输出所有生成小图的途径过程中的小图全部输出,就是产生的候选框。
合并规则:
- 颜色(颜色直方图)相近的
- 纹理(梯度直方图)相近的
- 合并后总面积小的
- 合并后,总面积在其BBOX中所占比例大的
例:设有区域a-b-c-d-e-f-g-h。较好的合并方式是:ab-cd-ef-gh -> abcd-efgh -> abcdefgh。
不好的合并方法是:ab-c-d-e-f-g-h ->abcd-e-f-g-h ->