【深度学习】从YOLOv1到YOLOv3

Introduction

从YOLOv1到YOLOv3,YOLO系独树一帜,自成一派,是检测算法领域的一股(朵)清(奇)流(葩)。

YOLOv1

论文地址:You Only Look Once: Unified, Real-Time Object Detection

这里写图片描述

是one-stage系检测算法的鼻祖。即只通过一个stage就直接输出bbox和类别标签:
这里写图片描述

原理是将每张输入图片等分地化为 S × S S\times S S×S个grid进行预测:
这里写图片描述

其网络结构如下:
这里写图片描述

关于YOLOv1的详细解读,请参见我的另一篇博客:YOLO: Unified, Real-Time Object Detection 笔记

YOLOv2

论文地址:YOLO9000: Better, Faster, Stronger

这里写图片描述

作者通过发明的一系列骚操作(Dimension Clusters、Direct location prediction、Multi-Scale Training、DarkNet-19),再加上博采众长,共同构成了此篇神作。创新点很多,也因此获得了2017CVPR最佳论文提名奖。

Dimension Clusters (维度聚类) 。经过对VOC数据集和COCO数据集中bbox的k-means聚类分析,将anchor机制中原本惯用的 9 anchor 法则 删减为仅保留最常出现的 5 anchor 。其中,狭长型的anchor是被保留的主体:
这里写图片描述

Direct location prediction (直接位置预测) 。用新的位置预测算法来缩小参数范围,使之更容易学习,也使得网络更加稳定:
这里写图片描述

看detection的主流backbone VGG-16不顺眼,嫌弃它计算量太大(224×224的图像需要计算30.69 billion次浮点运算),于是自己咔咔咔整了个DarkNet-19出来:
这里写图片描述

关于YOLOv2的详细解读,请参见我的另一篇博客:YOLO9000: Better, Faster, Stronger 笔记

YOLOv3

论文地址:YOLOv3: An Incremental Improvement 笔记

这里写图片描述

在保证较高检测速度的情况下,大大提升了YOLO系算法的检测精度:
这里写图片描述

把DarkNet-19玩到了DarkNet-53:
这里写图片描述

对于小物体的漏检情况得到了很大的改善:
这里写图片描述

关于YOLOv3的详细解读,请参见我的另一篇博客:YOLOv3: An Incremental Improvement

Summary

相信马上会有YOLOv4、YOLOv5等后传被作者做出来。静待。


[1] YOLO: Unified, Real-Time Object Detection 笔记
[2] YOLO9000: Better, Faster, Stronger 笔记
[3] YOLOv3: An Incremental Improvement 笔记
[4] You Only Look Once: Unified, Real-Time Object Detection
[5] YOLO9000: Better, Faster, Stronger
[6] YOLOv3: An Incremental Improvement
[7] 物体检测论文-YOLO系列

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值