目标检测基本概念
什么是目标检测
目标检测关注图像中特定的物体目标,要求同时获得这一目标的类别信息和位置信息。检测给出的是对图片前景和背景的理解,需要从背景中分离出感兴趣的目标,并确定这一目标的描述(类别和位置,常用检测框表示)
与图像分类的区别,目标检测更具难度:
图像分类只需要判断输入的图像中是否包含感兴趣物体,而不需要定位具体位置
目标检测的思路
如果知道了图中某个位置存在物体,再将对应的局部区域送入到分类网络中去进行判别,就可以知道图像中每个物体的位置和类别。
要想知道每个物体的位置,要使用“猜”的方式,也就是通过滑窗罗列图中可能区域,一个个去试,分别送入到分类网络进行分类得到其类别,同时我们会对当前的边界框进行微调,这样对于图像中每个区域都能得到(class,x1,y1,x2,y2)五个属性,汇总后最终就得到了图中物体的类别和坐标信息。
总结:先确立众多候选框,再对候选框进行分类和微调。
目标框的定义方式
图中的两种格式在不同场景下更加便于计算
def xy_to_cxcy(xy)