一、滑动窗口
用已知尺寸的窗口遍历整个图像,生成很多子图像,漫无目的的搜索。
二、selective search
selective search在rcnn和fast rcnn中用到,它的具体做法是将图像分割成很多小的区域,计算区域之间的相似度(颜色、纹理等等),结合各尺度结果,进行融合,形成大一些的region。具体参见https://blog.csdn.net/qq_32172681/article/details/99083358
三、RPN(region proposal network),区域生成网络
本文主要讲解的是region proposal network,RPN是faster rcnn的核心,它的本质是基于滑窗的无类别obejct检测器,图像每个位置有多种类型的anchor boxes(region proposal),用这些region proposal 训练 faster rcnn,分类和框回归通过梯度下降反向传播调节网络参数,重新生成region proposal,再继续训练faster rcnn,不断重复这个过程。
1、anchor
anchor就是feature map上的一个像素,以该anchor为中心,可以生成k种anchor boxes(region proposal),每个anchor boxes有着不同的宽高比和缩放比,论文中使用