一、基于候选区域的目标检测器
滑动窗口检测器
根据滑动窗口从图像中剪切图像块,把图像块处理成固定大小。随后输入CNN分类器中,提取特征。最后使用SVM分类器识别种类,并且用线性回归器得到边框。
选择性搜索selective search
首先将每个像素作为一组。
然后,计算每一组的纹理,并将两个最接近的组结合起来。
但是为了避免单个区域吞噬其他区域,我们首先对较小的组进行分组。我们继续合并区域,直到所有区域都结合在一起。
R-CNN
R-CNN 利用候选区域方法创建了约 2000 个 ROI。这些区域被转换为固定大小的图像,并分别馈送到卷积神经网络中。该网络架构后面会跟几个全连接层,以实现目标分类并提炼边界框。
比滑动窗口更快速、更准确。
边界框回归器
使用回归的方法,将蓝色边界框转变成红色边界框。
经过平移、缩放,得到回归窗口。
把A框经过映射,得到与真实窗口G框更接近的回归窗口G’。