YOLO V3 论文阅读总结和讨论

 

YOLO V3 论文阅读总结和讨论

YOLO V1: https://github.com/leoluopy/paper_discussing/blob/master/yolo/yolo1/yolo1_discussing.md

YOLO V2:https://github.com/leoluopy/paper_discussing/blob/master/yolo/yolo2/yolo2_discussing.md

YOLO V3:https://github.com/leoluopy/paper_discussing/blob/master/yolo/yolo3/yolo3_discussing.md

look for papers for yolo3 contributer : leoluopy

github地址:https://github.com/leoluopy/paper_discussing/blob/master/yolo/yolo3/yolo3_discussing.md

Overview

  • 相对于yolov2,提出了darknet53,并增加更多passthrough layer , 体积更大,但是更精准。
  • 在 320 × 320 分辨率下,YOLOv3 每帧 22 ms 并达到 28.2 mAP,和相同分辨率SSD一样精准,但是快3倍。

 

与YOLOV2 对比

  • 使用相同的 BoundingBox 预测tensor , 通过nms,每一个box仅预测一个object
  • 与v2 不同,增加了更多尺度,使用了 3个尺度进行预测 , 先验框使用 3个,簇使用9个簇,9个簇被均匀分割3份到3个不同的尺度预测tensor上。

    On the COCO dataset the 9 clusters were: (10 × 13), (16 × 30), (33 × 23), (30 × 61), (62 × 45), (59 × 119), (116 × 90), (156 × 198), (373 × 326).

  • 特征提取器更新为:darknet53。 网络设计思路: 仍然采用3x3卷积提取特征,1x1卷积进行特征压缩 ; 另外在特征提取网络中也加入类似与resnet中的 shortCut机制。
  • Darknet-53 在相似准确率情况下对于 ResNet-101 快一半. Darknet-53 比 ResNet-152 快一倍 (速度测试在 TITAN X)
  • 在训练方法上与YOLOv2基本保持一致,没有对困难样本单独处理,仍然是多尺度训练,每层卷积后加BN,图像采用多种数据增强。

 

 

  • 2
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值