把检测问题转化成回归问题,一个CNN返回X,Y,W,H就搞定了
YOLOV1学习
X,Y,W,H,C:横坐标、纵坐标、宽、高、置信度
IOU:标注框和预测框的交集/标注框和预测框的并集,可以表示预测框的准确度,两个框重合度越高即越趋近于1表示准确度越高
训练时YOLOv1将一张图片分为7X7的格子,每个格子预设两个预测框(XYWHC),然后比较标注框和预测框的IOU,谁的高用谁,返回的一个特征值7X7X30,7X7就是图片分的格子,30就是两个预测框2X5+20个分类(分类不固定可以是10个80个)
损失函数: