目标检测是计算机视觉领域中一个新兴的应用方向。
目标定位
图像分类是对图像进行分类,比如判断图像中是否是车。定位分类不仅要图片分类,而且需要确定目标在图像中的哪个位置。目标检测中要识别的对象不仅仅只有一个,目标检测要识别图像中多个对象。
自动驾驶需要用到目标检测技术。给出一张汽车行驶中的图片
我们需要判断图中1-是否有行人,2-是否有车,3-是否有摩托车,4-图片是否只是背景图,还需要判断图中汽车的位置。设图片左上角的坐标是(0,0),右下角坐标为(1,1)。图中汽车的中心点位置大概为 (bx=0.5,by=0.7) ( b x = 0.5 , b y = 0.7 ) ,汽车的长和高分别是 bw=0.3 b w = 0.3 和 bh=0.4 b h = 0.4 。我们训练的神经网络就要有两种类型的输出,一种是4种对象的检测,另外一种是车的位置信息。
我们定义这张图片的标签y要包含下面几个元素
y=⎡⎣⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢pc(是否有对象)bxbybhbwc1(是否有行人)c2(是否有汽车)c3(是否摩托车)⎤⎦⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥ y = [ p c ( 是否有对象 ) b x b y b h b w c 1 ( 是否有行人 ) c 2 ( 是否有汽车 ) c 3 ( 是否摩托车 ) ]