yolov5学习笔记

最新推荐文章于 2024-05-24 21:16:50 发布

之子无裳

最新推荐文章于 2024-05-24 21:16:50 发布

阅读量539

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZHUYOUKANG/article/details/113390249

版权

深度学习专栏收录该内容

11 篇文章 1 订阅

订阅专栏

这篇博客写的很详细yolov5理论学习笔记，我这里主要结合代码再进行自己的总结记录。

YOLOV5和V4对比

参考，v5还没正式发表论文，该链接总结可能与最终版本存在出入。我这里下载最新版本，结合源码重新做了总结
1）数据增强上，v4使用crop/遮挡/cutmix/mosaic多种数据增强技术，v5scale/hue/mosaic，v4借鉴了v5的图像增强（这部分暂时没看最新源码）
2）v4使用了标签平滑技术，v5没有（最新源码有标签平滑代码，只是没有提供参数，默认不使用标签平滑）
3）v5有自适应瞄框
4）都使用cspdarknet做backbone，spp+pan做neck
5）v4使用Mish激活函数（计算代价高），v5使用Leaky ReLU
6）损失函数，YOLO V5使用 GIOU Loss作为bounding box的损失，YOLO V4使用 CIOU Loss作为bounding box的损失（v5最新源码也使用了CIOU）
7）v5大大提高了正样本数量，每个框的中心位置附近四舍五入再在相邻两个位置在增加两个正样本，样本标签的x，y范围也变成了（-0.5~1.5)，最终生成bbox公式也不一样。
在这里插入图片描述正样本增加了三倍左右，模型得以快速收敛

网络结构

1）Focus结构，对输入的四种下采样切片后Concat,输入[n,c,h,w]->[n,c*4,h/2,w/2]

在这里插入图片描述 2)csp1与上面链接不一样，concat后没有bn+leakrelu,不知是不是Yolo v5还在更新的原因

后续补充

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
yolov5学习笔记

这篇博客写的很详细yolov5理论学习笔记，我这里主要结合代码再详细进行学习记录。网络结构1）Focus结构，对输入的四种下采样切片后Concat,输入[n,c,h,w]->[n,c*4,h/2,w/2]2)
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。