YOLOv5简析

本文简析YOLOv5相对于YOLOv4的改进,包括输入端的Data Augmentation、自适应锚框计算和自适应图片缩放;Backbone中的Focus和CSP结构;Neck部分的FPN+PAN结构,以及预测阶段的损失函数和NMS策略。YOLOv5在保持高性能的同时,提高了模型的灵活性和推理速度。
摘要由CSDN通过智能技术生成

先说些题外话,YOLOv5没有论文,其作者是Mosaic Augmentation 的创造者,YOLO V5 在性能上稍弱于YOLO V4,但是在灵活性与速度上远强于YOLO V4,在模型的快速部署上具有极强优势。相对于YOLOv4,分别从以下三个方面简析YOLOv5的改进:

  • 输入端:Data Augmentation、自适应锚框计算、自适应图片缩放
  • Backbone:Focus结构,CSP结构
  • Neck:FPN+PAN结构

1. 输入端

1.1 Data Augmentation主要采用的是Mosaic数据增强
其做法就是对图片使用随机缩放、随机裁剪、随机排布的方式进行拼接。优点是丰富了检测物体的背景和小目标,并且在计算Batch Normalization的时候一次会计算四张图片的数据,使得mini-batch大小不需要很大,一个GPU就可以达到比较好的效果。
1.2 自适应锚框计算
在YOLOv3和YOLOv4中,都需要提前通过K-means聚类的方法计算出anchor,此anchor是固定的。但是在YOLOv5中,虽然也提前设置了anchor,但是在训练时可以自适应的计算不同训练集中的最佳anchor,从而更新anchor值。此功能也可以手动关闭,在train.py中更改,设置为False即可。
在这里插入图片描述
1.3 自适应图片缩放
在常用的目标检测算法中,不同的图片长宽都不相同,因此常用的方式是将原始图片统一缩放到一个标准尺

  • 7
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

折磨王

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值