Region 16, Region 20表示两个不同尺度上检测的结果。
16卷积层为最大的预测尺度, 可以预测出较小的物体;
20卷积层为最小的预测尺度, 可以预测出较大的物体。
我们发现每次迭代都有两组Region 16, Region 20。
因为在darknet中,所有训练图片中的一个批次(batch)又被分成subdivision份来进行计算,而该训练过程 .cfg 文件中设置的batch=32,subdivisions=2,所以就有两组Region 16, Region 20,每组中用到了16张图片。
Region xx Avg IOU: 表示在当前subdivision内的图片的平均 IOU(预测的矩形框和真实目标的交集与并集之比);越大越好,最大为1。
Class: 标注物体分类的正确率;越大越好,最大为1。
Obj:越接近 1 越好;
No Obj:期望该值越来越小, 但不为零;
.5R:以与ground true的iou大于0.5为正样本时的recall/count,是当前模型在所有 subdivision 图片中检测出的正样本与实际的正样本的比值。全部的正样本被正确的检测到应该是1。
.75R:以与ground true的i