Guassian YOLOv3 | ICCV2019，更快更强的YOLOv3

最新推荐文章于 2024-07-19 13:44:40 发布

yuanCruise

最新推荐文章于 2024-07-19 13:44:40 发布

阅读量5k

点赞数 3

分类专栏：深度学习论文解读

本文链接：https://blog.csdn.net/qiu931110/article/details/102768978

版权

本文介绍了如何通过引入高斯分布改进YOLOv3，以输出每个检测框的不确定性，从而增强目标检测的精确性和可靠性。通过对网络输出的扩展和损失函数的调整，Gaussian YOLOv3在保持计算效率的同时，提高了目标检测的MAP性能。

摘要由CSDN通过智能技术生成

在目标检测的落地项目中，实时性和精确性的trade-off至关重要，而YOLOv3是目前为止在这方面做得最好的算法。本文通过高斯分布的特性，改进YOLOv3使得网络能够输出每个检测框的不确定性，从而提升了网络的精度。

1.YOLOv3简介

如下图a所示，为YOLOv3的网络架构。
YOLOv3使用了skip shotcut的操作方式网络过深而引起的梯度消散。
YOLOv3使用了up-sample操作，并将大特征图和小特征图upsample后的特征图进行concat，使网络能够拥有既包含丰富的高层抽象特征和精确的位置信息特征的融合特征层。
YOLOv3使用了特征金字塔结构，使得网络能够在三个不同的尺度特征下做目标检测，能够适应与多种不同大小的目标检测任务。

如下图b所示，为利用YOLOv3进行目标检测时的网络输出。
RGB图像作为YOLOv3网络的输入，检测结果会在三个不同的尺度分别输出，包含了目标的坐标位置，目标是正样本还是负样本，目标属于那个类别的置信度，对于每个尺度的分支而言，会在每个grid中会预测出三个结果（因为每个尺度下会有三个anchor）。最终将三个尺度的结果合并，进行非极大值抑制（NMS）后，输出最终的检测结果。

正如YOLOv3的输出结果所述，目标类别是有概率值的，但目标框只有位置而没有概率值，也就是从结果中无法预知当前目标框的可靠性。基于此本文利用Guassian模型来对网络输出进行建模，在基本不改变YOLOv3结构和计

最低0.47元/天解锁文章

yuanCruise

关注

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
11
评论
Guassian YOLOv3 | ICCV2019，更快更强的YOLOv3

在目标检测的落地项目中，实时性和精确性的trade-off至关重要，而YOLOv3是目前为止在这方面做得最好的算法。本文通过高斯分布的特性，改进YOLOv3使得网络能够输出每个检测框的不确定性，从而提升了网络的精度。1.YOLOv3简介如下图a所示，为YOLOv3的网络架构。YOLOv3使用了skip shotcut的操作方式网络过深而引起的梯度消散。YOLOv3使用了up-sample操...
复制链接

扫一扫