论文背景
论文全称:YOLOv3: An Incremental Improvement
论文链接:https://arxiv.org/abs/1804.02767
论文日期:2018.4.8
本文对YOLO进行了优化,设计了一个新的神经网络,这个神经网络的结构更复杂,但是准确率更高。并且也很快,使用320 × 320的输入,运行速度为22ms,运行准确率为28.2mAP。运行速度比SSD快3倍。
创新点:
- 使用独立的逻辑分类器代替softmax算法;
- 使用空间金字塔结构预测边界框;
- 设计了darknet-53神经网络结构。
算法简介
边界框的尺寸设置:
与YOLOv2相同,使用维度聚类的方法来预测边界框,每个单元格预测3个尺寸;
在训练期间,我们使用平方误差损失的总和。假设对于一些坐标预测的值是tˆ∗ ,梯度就是由ground truth box计算出的ground truth的值减去预测值:t