目标检测
1.1含义
识别图片中有哪些物体以及物体的位置(坐标位置)。
物体指的是图片中存在的物体,图片中经过目标检测能够检测出的物体取决于数据集标注物体的种类。假设数据集标注的物体有鸟、狗、马、人四类,检测结果就如图 1-1所示,图片中的湖水、土地、天空等不会被检测出来。
物体的坐标位置有两种表示方法(以图片左上角为原点(0,0)):
1.极坐标:(xmin, ymin, xmax, ymax)
- xmin,ymin:检测框左上角坐标
- xmax,ymax:检测框右下角坐标
物体坐标位置如果是极坐标(1,1,4,4),物体位置如图 1-2所示。
2.中心坐标:(x_center, y_center, w, h)
- x_center, y_center:检测框的中心点坐标
- w,h:检测框的宽、高
物体坐标位置如果是中心坐标(2,3,2,4),物体位置如图 1-3所示。
1.2 挑战
目标检测可以应用于行人检测、人脸检测、文本检测、交通标志/灯光检测以及遥感目标检测等多个领域。不同检测任务的目标和限制并不相同,因此它们面临的挑战也存在差异。除了计算机视觉的常见挑战:不同视角、变化的光照,还包括以下方面:物体旋转和尺度变化、精确定位、密集、遮挡的物体、检测速度等。
行人检测的挑战:小行人、困难负样本、密集拥挤的人群、实时检测。
人脸检测:人脸扭曲、遮挡、多尺度检测、实时检测。
文本检测:不同的字体和语言、文本旋转和透视变形、密集排布的文本定位、残缺和模糊的字符。
交通标志和交通灯检测:照明变化、运动模糊、恶劣天气、实时检测。
遥感目标检测:“大数据”中的检测’、遮挡目标、维度适应。