yolov5详解(一)

一直想对yolov5做一个总结,趁着现在不忙,总算是有机会了。正题开始:

yolov5网络结构部分

在这里插入图片描述
在这里插入图片描述

一:输入部分处理
1、数据增强—Mosaic数据增强

在这里插入图片描述
-Mosaic借鉴Cutmix数据增强技术,使用4张图像进行拼接,使得模型在更小范围内识别到目标。
步骤:
1.随机选取图片拼接基准点坐标,随机选取4张图片
2.四张图片根据基准点。进行尺寸和缩放比例调整,放到指定尺寸的大图上
3.根据每张图像的尺寸变换方式,将映射关系对应到图片标签上
4.根据指定的横纵坐标,对大图进行拼接。处理超过边界的检测框坐标
使用数据增强的优点:
1.丰富数据集的多样性
2.增强模型的鲁棒性和泛化能力
3.有助于小目标检测效果的提升
4.增强BN归一化效果:数据变多,训练时会增加batch_size,BN计算的均值和方差会接近于整体数据的均值和方差

2、自适应锚框计算
v3和v4版本的自适应锚框计算,需要在训练之前使用单独的代码得到。而v5是把这个功能嵌入到训练代码里了,在每次训练开始时,v5会根据数据集的不同,自行计算自适应锚框。
自适应锚框计算步骤:
1.获取数据集中所有目标的框的尺寸
2.把每张图像进行等比例resize到指定大小
3.将目标框从相对坐标改到绝对坐标(坐标乘以缩放后的宽高)
4.保留宽高大于等于2个 像素的框,过滤框
5.使用k-means算法聚类得到n个anchors
6.使用遗传算法随机对anchors的宽高进行变异。如果变异后的效果好,就把变异后的结果赋值给anchors,否则就跳过,默认变异1000次。v5使用anchor_fitness方法计算得到的适应度fitness,再进行评估。

3、自适应图片缩放
在常用的目标检测算法中,不同的图片长宽都不相同,因此常用的方式是将原始图片统

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值