因为网络和实际值都是分了两层,就是y_pred=[y_pred1,y_pred2],y_true=[y_true1,y_true2],那么计算损失的时候,会把y_pred1和y_true1进行比较,计算loss1, 把y_pred2和y_true2进行比较,计算loss2,总损失loss=loss1+loss2
现在我们来先观察下loss1的计算过程,假设batch_size=4,训练样本为1.jpg,2.jpg,3.jpg,4.jpg,
loss1=xy_loss + wh_loss + confidence_loss + class_loss
其中
代表由图片i.jpg所产生的误差,以为例来说明其计算过程
=object_mask * box_loss_scale * K.binary_crossentropy(raw_true_xy, raw_pred[..., 0:2], from_logits=True)
object_mask=1或, 若这个y_true中这个box有物体=1,没有物体=0
box_loss_scale=2-w*h(w,h为y_true中box的宽高)
raw_true_xy=[13*(x_true-1),13(y_true-1)] (这个是小于0的数)
raw_pred[..., 0:2]=[pred_x,pred_y]#网络预测值,直接是卷积层出来的,没有经过sigmodi函数
交叉熵=[13*(x-1),13(y-1)]*log([pred_x,pred_y])+(1-[13*(x-1),13(y-1)])*log{1-[pred_x,pred_y]}
yolo_head:
原型
yolo_head(feats, anchors, num_classes, input_shape, calc_loss=False)
被调用时的入参为:
grid,