目录
1.anchor的计算机制
- 锚框anchor是真值框和预测框之间的桥梁:预测框在锚框基础上,预测出框的大小,锚框和实际框通过IoU进行关联
- 网络直接预测的是特征图中当前单元格相对于锚框的偏置tx,ty,tw,th,然后通过下面关系式计算得到bx,by,bw,bh(真值标签也是bx,by,bw,bh四个值,从而计算loss)
上式中:
- 即为预测的边界框bounding box在feature map中的中心点坐标和长宽;
- 即为网络学习的相对于先验框(prior,anchor)的offsets;
- 是各个单元格的左上点坐标(即先验框中心点的参考点为单元格的左上顶点); 即为先验框(prior,anchor)相对于特征图尺度的长和宽
若我们需要得到预测框相对于原图的坐标实际值,则只需要将乘以该特征图的降采样倍数,如8,16,32等。
anchor的调整可视化
以13x13特征图大小为例,如下图所示,各个点为单元格的顶点,左图是以黑色顶点为中心的三个anchor,右图是三个anchor调整后的结果,即三个预测框,红点为三个预测框的中心点。
2.anchor对应机制
- 一个单元格有3个锚框,在计算Loss时并不是三个锚框对应的预测框都与真值框进行比较,而是只采用1个预测框进行计算diff,即:采用与真值框之间IOU最大的锚框所对应的预测框进行计算,忽略另外2个预测框
3.网络结构
- ResUnit与Resnet18类似,依次为1x1卷积3x3卷积,然后相加add
- ResX中第一个CBL为stride=2的卷积,进行降采样操作
4.训练过程
5.测试过程
参考:目标检测YOLO系列