论文(一)YOLOv1详解

本文详细介绍了YOLOv1目标检测算法,包括算法原理、主干网络结构、网络训练方法,特别是dropout技术的应用,以及损失函数的设计。通过分析,探讨了YOLOv1的优势和不足,并分享了学习过程中的思考与参考资料。
摘要由CSDN通过智能技术生成

YOLOv1-详解

论文下载:http://arxiv.org/abs/1506.02640

代码下载:https://github.com/pjreddie/darknet

目录

前言

(一)算法原理

(二)主干网络

(三)网络训练

dropout:

(四)损失函数

(五)网络预测

(六)优缺点

(七)一些思考



前言

写这篇博客是为了以后再看到yolo时有个参考,同时供各位交流学习,水平有限,欢迎各位交流学习,批评指正。

在正文开始之前,先附上我在学习过程中的参考资料,感谢各位博主学者分享。

参考资料:

1. yolov1论文翻译1:https://blog.csdn.net/shuiyixin/article/details/82533849

2. yolov1论文翻译2:https://blog.csdn.net/m0_37192554/article/details/81092761

3. yolov1论文笔记1:https://zhuanlan.zhihu.com/p/24916786?utm_source=qq&utm_medium=social

4. yolov1论文笔记2:https://zhuanlan.zhihu.com/p/94986199

5. 什么是mAP:https://blog.csdn.net/shuiyixin/article/details/86349643

6. 分类与回归:https://blog.csdn.net/shuiyixin/article/details/88816416

7. tf_yolov3代码解析:https://blog.csdn.net/sxlsxl119/article/details/103028005

8. 入门级yolo教程:https://blog.paperspace.com/how-to-implement-a-yolo-object-detector-in-pytorch/


(一)算法原理

假设我们处理的图片是一张正方形图片,yolo将图片分割为SxS个grid(网格),每个网格大小相等,如下图所示:

preview

每个网格预测B个bounding boxs,每个bbox包含5个量(x, y, w, h, confidence),其中,x,y表示bbox的坐标,w和h为bbox的宽和高,confidence表示这个bbox含有目标的概率及坐标预测的准确率;另外,每个网格还需要预测该网格中物体的类别,这里物体类别用one-hot编码表示。因此,整个ground truth的长度为:SxSx(Bx5+C)。在yolov1中,将图片分为7x7的网格,每个网格预测2个bboxs,共98个bboxs。更直观详细的关于bbox的解释如图所示(https://zhuanlan.zhihu.com/p/24916786?utm_source=qq&utm_medium=social):

  • 4
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值