yolo框架学习笔记——各版本对比

最新推荐文章于 2024-08-08 14:55:12 发布

hehehetanchaow

最新推荐文章于 2024-08-08 14:55:12 发布

阅读量3.5k

点赞数 4

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hehehetanchaow/article/details/111042975

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

参考链接：https://blog.csdn.net/weixin_47196664/article/details/107479182

https://zhuanlan.zhihu.com/p/76802514

https://blog.csdn.net/c20081052/article/details/105995753

cfg文件查看工具

YOLOV4：

1）相较于YOLO V3的DarkNet53，YOLO V4用了CSPDarkNet53

2）相较于YOLO V3的FPN,YOLO V4用了SPP+PAN

3）CutMix数据增强和马赛克（Mosaic）数据增强

4）DropBlock正则化

等等

自己的记录：

1）backbone使用了5个CSP模块(1,2,8,8,4),得到19*19大小的特征图(608->304->152->76->38->19)。

而且作者只在Backbone中采用了Mish激活函数，网络后面仍然采用Leaky_relu激活函数。

CSPNet的作者认为推理计算过高的问题是由于网络优化中的梯度信息重复导致的。所以这里采用csp的结构，主要优点在于：增强CNN的学习能力，使得在轻量化的同时保持准确性;降低计算瓶颈;降低内存成本

YOLOv3:

主要体现在网络结构上的改变。

backbone改成了Darknet-53

YOLOv2:

1）引入了fast-rcnn中的anchor box的思想

2）输出层改为卷积层代替全连接层

3）去掉了dropout层，改为利用更多的BN等方法

4）使用k-means的方法来对训练集中的先验框进行聚类，生成合适的先验框

YOLOv1:

1）输入图像是固定尺寸

2）输出层为全连接层

关注

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。