YOLO系列算法原理介绍

1. Yolo介绍:

1.1 YOLO:
You Only Look Once,是一种基于深度神经网络的对象识别和定位算法,其最大的特点是运行速度很快,可以用于实时系统。
Joseph Redmon和Ali Farhadi等,2015年首次提出。
在2017年的CVPR上,Joseph Redmon和Ali Farhadi又提出了YOLO2,后又再次提出了YoloV3。

1.2 特点:

  1. One-stage
  2. 同时预测多个bbox和类别
  3. 端到端的目标检测和识别
  4. 速度更快:
    ----实现回归功能的CNN并不需要复杂设计;
    ----直接选用整图训练模型,更好的区分目标和背景区域。

1.3 实现方法:

  1. 图像被分成S×S个格子, 如下图所示:
  2. 如果某个object的中心落在这个网格中,则这个网格就负责检测这个object
  3. 每个格子要预测B个检测框及其置信度,以及C个类别概率
  4. 每个bounding box要预测(x, y, w, h)和confidence共5个值
    ----confidence代表了所预测的box中含有object的置信度和这个box预测的有多准两重信息,其值这样计算: Pr(object)×IOU(gt, pred)
  5. 输出就是S x S x (5*B+C)的一个tensor
    ----举例说明: 在PASCAL VOC中,图像输入为448x448,取S=7,B=2,一共有20个类别(C=20)。则输出就是7x7x30的一个tensor。在这里插入图片描述

2. YoloV1网络结构

2.1 网络结构如下图所示:
在这里插入图片描述

2.2 网络结构分析:

  1. 网络结构借鉴了 GoogLeNet 。24个卷积层,2个全链接层。(用1×1 reduction layers 紧跟 3×3 convolutional layers 取代Goolenet的 inception modules )
  2. 网络使用小卷积,即1×1和3×3
  3. FC输出为:S×S×(5×B+C)
  4. 网络比VGG16快,准确率稍差

2.3 LOSS函数:

  1. 均方和误差之和,包括:坐标误差、IOU误差和类别误差
  2. 权重考量,整个的损失函数如下图所示:
    在这里插入图片描述

3. YoloV1网络训练

  1. 预训练分类网络:
    在 ImageNet 1000-class competition dataset上预训练一个分类网络

  2. 使用预训练参数(20个con)来初始化YoloV1,并训练VOC20

  3. 将输入图像从224×224 resize为448×448

  4. 训练时B个bbox的GT设置相同

4. YoloV1的不足

  1. 输入尺寸固定
  2. 小目标检测效果差:
    ----同一个格子包含多个目标时, 仅预测一个(IOU最高)

5. YoloV1的网络性能

在这里插入图片描述

6. 参考网页:

https://blog.csdn.net/gbyy42299/article/details/88869766?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

https://blog.csdn.net/qq_43211132/article/details/90731088?utm_medium=distribute.pc_relevant_t0.none-task-blog-OPENSEARCH-1.nonecase&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-OPENSEARCH-1.nonecase

YOLOv1,YOLOv2,YOLOv3解读: https://blog.csdn.net/hancoder/article/details/87994678

  • 0
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值