yolov3的论文实际上是一篇学术报告,这篇论文里面有一些作者的幽默风趣的不学术不专业的话,摘要听起来就像是在分享日常,这就是大佬的任性吧...
这张图片是yolov3和其他的模型性能的一个对比,突出了yolov3在速度和精度上面都优于其他模型。
不过这张图是作者从别人论文里面借鉴的,而左边这个都跑到图外面的yolov3的线就是作者加上的...好高级的装b手法(bushi)
1.Bounding Box Prediction(边界框预测)
yolov3沿用了v2中限制预测框位置的方法 见yolov2学习笔记
与之前不同的是关于正负样本的处理,v1和v2置信度标签为IoU值,作者将它修改为与ground truth的IoU最大的anchor的置信度为1,其他都为0(所以即使IoU比较大如果不是最大的全部都忽略)。
这么做的原因
需要注意的是由于yolov3有三种尺度(下采样倍数不同)所以计算时需要乘上下采样倍数得到原始的预测框坐标。
2.Class Prediction(多类别标注与分类)
而yolov3使用Sigmoid函数为每个类别预测概率
pi 是第 i 类的概率,zi 是模型对该类的原始输出分数。因为每个类别的概率是独立计算的,所以可以有多个类别的概率接近或等于1,意味着一个物体可以属于多个类别。适用于多标签分类或多目标检测任务,其中一个物体可以被标记为多个类别。
3.Predictions Across Scales(多尺度目标检测)
yolov3实现了三种不同的尺度(每个尺度有3个设定好的anchor)的检测,分别是下采样倍数32x32、16x16、8x8,下采样倍数越大对应每个grid cell的感受野越大预测的物体也相对越大,所以它们分别预测不同大小的物体。
4.Feature Extractor(特征提取)
yolov3使用了新的骨干网络Darknet-53来进行特征提取,包括52个卷积层和1个全连接层。
5.损失函数
参考
【精读AI论文】YOLO V3目标检测(附YOLOV3代码复现)
深入浅出Yolo系列之Yolov3&Yolov4&Yolov5&Yolox核心基础知识完整讲解