yolov3详解

佛系调参

已于 2022-04-16 22:08:53 修改

阅读量5.9k

点赞数 7

分类专栏：计算机视觉深度学习文章标签：深度学习人工智能机器学习

于 2019-08-01 11:11:11 首次发布

本文链接：https://blog.csdn.net/yzy__zju/article/details/98039103

版权

24 篇文章 0 订阅

订阅专栏

21 篇文章 1 订阅

订阅专栏

1.anchor的计算机制

preview

锚框anchor是真值框和预测框之间的桥梁：预测框在锚框基础上，预测出框的大小，锚框和实际框通过IoU进行关联
网络直接预测的是特征图中当前单元格相对于锚框的偏置tx,ty,tw,th,然后通过下面关系式计算得到bx,by,bw,bh（真值标签也是bx,by,bw,bh四个值，从而计算loss）

上式中：

$(b_{x},b_{y},b_{w},b_{h})$ 即为预测的边界框bounding box在feature map中的中心点坐标和长宽；
$(t_{x},t_{y},t_{w},t_{h})$ 即为网络学习的相对于先验框(prior,anchor)的offsets；
$(c_{x},c_{y})$ 是各个单元格的左上点坐标(即先验框中心点的参考点为单元格的左上顶点)； $p_{h},p_{w}$ 即为先验框(prior,anchor)相对于特征图尺度的长和宽

若我们需要得到预测框相对于原图的坐标实际值，则只需要将 $(b_{x},b_{y},b_{w},b_{h})$ 乘以该特征图的降采样倍数，如8,16,32等。

anchor的调整可视化

以13x13特征图大小为例，如下图所示，各个点为单元格的顶点，左图是以黑色顶点为中心的三个anchor，右图是三个anchor调整后的结果，即三个预测框，红点为三个预测框的中心点。

一个单元格有3个锚框，在计算Loss时并不是三个锚框对应的预测框都与真值框进行比较，而是只采用1个预测框进行计算diff，即：采用与真值框之间IOU最大的锚框所对应的预测框进行计算，忽略另外2个预测框

关注

专栏目录