前言
我们再更多的情况下不仅仅想要将图像分类,我们还想判断这个物体到底在图像的哪个部位上,所以说这时候目标探测应运而生。
目标探测,除了要使用softmax判断类别外,还需要一个边界框(以中心点的x,y和宽和高四个参数来体现)。
涉及的技术
有判断轮廓的landmarkdetection
有判断是否有物品的object detection
还有我们的localization and detection
如何实现?
滑动窗口
我们首先需要训练一个能识别汽车的卷积神经网络,然后一个直观的想法就是说我们使用一个小框,不停的滑动,不断通过分类器对于框内的图像进行识别。这种方法的缺点现在于计算成本较大,要是想精准的找到合适大小的窗口匹配上,需要不断调整大小反复调用分类器,所以是粗粒度也不是,细粒度也不是。
滑动窗口的卷积实现
为了构