yolo v1 预测框坐标解析
预测框 专业叫法 ===> (bounding boxs)
输出
一 、 输出为7*7的网格图,共49个小图
二 、 每个小图的维度为 [ 预测框个数 X (4 + 1) + 类别数 ]
4 : x y w h
x, y : 预测框中心位置
w,h : 预测框宽高
坐标的计算过程
x = (回归预测物体x坐标 - 该坐标所在单元格左上角 x 轴坐标) / 单元格宽度
y = (回归预物体y坐标 - 该坐标所在单元格左上角 y 轴坐标)/ 单元格宽度
w = 回归预物体宽度 / 预测框宽度
h = 回归预物体高度度 / 预测框高度
损失函数
损失函数一共有5项
1 中心坐标的损失函数,用了我们最熟悉的均方误差MSE
2 高和宽,没有简单的用MSE,而是用平方根的MSE
我们只考虑var1和var2在0和1之间。当var1和var2都很小的时候,也即是w和h都很小,意味着这个物体很小,那么我们应该尽量放大一些损失函数,让模型在识别小物体的时候准确一点。当var1和var2都很大,意味着这个物体也很大,甚至可能已经布满整张图片了,这时我么可以减小一些损失函数,毕竟很大的物体不需要很高的精度。
一句话,使用平方根的MSE而不是MSE其实就是像让模型对小尺度的物体更敏感
3 接下来的三项都使用了MSE