这是继RCNN,fast-RCNN ,faster-RCNN,SSD之后,又一新型方法YOLO
YOLO1的出现解决了基于DL的目标检测中一个大痛点------速度问题。
参数
每个bounding box要预测(x, y, w, h)和confidence共5个值,每个网格还要预测一个类别信息,记为C类。则SxS个网格,每个网格要预测B个bounding box还要预测C个categories。输出就是S x S x (5*B+C)的一个tensor
- x、y是相对于格子左上角的偏移量
yolo1中坐标的呈现规则:
- confidence置信度所含信息:bounding box是否含有物体,包含物体情况下位置的准确性,Pr(project)*IOU,Pr(project)不是1就是0
yolo1的问题,每一个grid只能用来预测一种问题,每个grid只选取一个IOU最高的boundingbox来检测,如果想一个grid预测两个问题,就要设定每个格子能返回两个向量,注意一个向量中就包含了B个bounding box