YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5的发展(1)

YOLO深度卷积神经网络已经经过原作者Joseph Redmon经过了3代4个经典版本(含YOLOv2和YOLO9000),后因为自己的研究成果被用于军事而道德不安,故放弃更新。
俄罗斯的AlexeyAB接下接力棒,完成了第4版迭代YOLOV4,并获得了Joseph官方认可。
现在,美国公司Ultralytics提出了YOLOV5,并保持持续更新。
需要注意的是,yolov1-v4都是有论文的,而v5并没有论文,只有开源的代码,而且一直保持更新状态。

发展历程
2016.5.9 yolov1
2016.12.25 yolov2
2018.4.8 yolov3
2020.4.23 yolov4
2020.6.10 yolov5

YOLOV1

yolov1作为yolo系列的开山之作,提出的创新思想主要是,不再提前选定候选区,直接在输出层回归目标框的位置和类别。

网络模型

前面的卷基层提取特征,后面的全连接层用于计算输出概率和坐标。

输入图像都需要统一到448×448个像素的RGB三通道的图像上,利用填充拉伸的方法。
第一层:使用分辨率为7×7×64卷积核(步长为2),将448×448×3的图像先变为224×224×64图像;再使用分辨率为2×2(步长为2)的最大池化层,将图像变为112×112×64的图像。
第二层:使用3×3×192的卷积核(步长为1),将112×112×64图像变为112×112×192图像;再使用分辨率为2×2(步长为2)的最大池化层,将图像变为56×56×192的图像。
第三层:使用1×1×128的卷积核(步长为1),将56×56×192图像变为56×56×128图像;使用3×3×256的卷积核(步长为1),将56×56×128图像变为56×56×256图像;使用1×1×256的卷积核(步长为1),56×56×256图像没有变化;使用3×3×512的卷积核(步长为1),将56×56×512图像变为56×56×512图像;再使用分辨率为2×2(步长为2)的最大池化层,将图像变为28×28×512的图像。
第四层:1×1×128的卷积核(步长为1)和3×3×256的卷积核(步长为1)先使用4次,再参考之前的方法,得到14×14×1024的图像。
第五层:得到7×7×1024的图像。
第六层:3×3×1024的两种卷积核使用后得到7×7×1024的图像。
第七层:单层全连接层,得到4096个元素。
第八层:7×7×30的全连接层,得到7×7×30个结果元素。
这就是yolov1结构,网络主体采用24个卷基层+2个全连接层的结构。从第一层到第八层:1+1+4+(2×4+2) +(2×2+2)+2=24。

检测过程

  • 将一副图像分成S*S个网格,如果某个物体的中心落在这个网格中,则这个网格负责预测这个物体。
  • 每个网格要预测B个bounding box每个bounding box除了要预测位置以外,还要预测一个置信度。每个网格还要预测C个类别的分数。输出就是SxSx[(4+1)*B+C]的一个tensor。
  • 根据阈值去除可能性低的窗口,利用非极大值抑制筛选出最终的结果。

损失函数
在这里插入图片描述
1.采用平方和误差
2.由于需要均衡不同输出值的数量级和大小对整个LOSS函数的影响,首先,使用了λcoord =5和λnoobj=0.5进行调节;其次宽高计算平方根的误差,而坐标直接计算误差(因为坐标是偏置值,普遍比宽高要小);再次,计算confidence时候,同时计算有目标和无目标的误差。
3.计算分类时候,只计算有目标的条件下的分类的准确性。
4.公式中 表示有物体中心落入的cell,需要计算分类损失,无目标就置0,通过这种方式减少运算量。

性能
在这里插入图片描述
map是精度,fps是速度。

不足
1.每个格子只能预测一个物体,成群的小目标无法预测。
2.由于输出层是全连接层,故只支持与训练图像相同的分辨率,其他分辨率需要填充或者拉伸成固定分辨率

  • 1
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值