YOLOv4理论学习

最新推荐文章于 2024-10-10 00:03:54 发布

咕噜咕噜开心加油

最新推荐文章于 2024-10-10 00:03:54 发布

阅读量519

点赞数 18

文章标签： YOLO 学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Linxiaojiejieya/article/details/140106291

版权

一：论文简介

yolov4：Optimal Speed and Accuracy of Object Detection

2020 CVPR

网络结构：Backbone：CSPDarknet53

neck：SPP、PAN

Head：YOLOv3

优化策略：Eliminate grid sensitivity、Mosaic data augmentation、IoU threshold(match posotive samples)、Optimizered Anchors、CIOU

二：CSPDarknet53

了解CSP：AI论文精读之CSPNet—— 一种加强CNN模型学习能力的主干网络

CSP的优点：提高CNN的学习能力、移除计算瓶颈、减少内存开销

CSPNet结构是在通道方向上进行均分

在yolov4中，先经过下采样，然后经过两个1*1的卷积层，卷积核的个数都是输入特征层的一半

CSPDarknet53的具体结构和YOLOv4整体的网络结构：YOLOv4网络详解

二：SPP

这里步距为1，通过padding，输入特征图大小和输出特征图高度、宽度和channel是一样的。通过SPP结构，能够在一定程度上解决多尺度问题

三：PAN

网络的backbone主要用于特征提取，在提取的特征层上构建特征金字(FPN)，就是将高层的语义信息往低层进行融合，而b是将低层语义信息向高层进行融合，这两部分融合在一起，就是PAN。在原来的PAN中，特征层融合是采用相加的策略，但是在YOLOv4中，是采用特征层在深度方向上进行拼接的策略

PANet（路径聚合网络）

四：优化策略

1.Eliminate grid sensitivity

如果gt box的中心点落在grid cell边界处，比如bx=cx，sigmoid(tx)=0，只有x趋近于无穷时才能等于0，所以引入了scale，对函数进行缩放和平移得到新的函数，则解决了gt box的中心点落在grid cell边界处的问题。

比较主流的代码中，scale=2

图像：蓝色是sigmoid，黄色是对其进行放大2倍，绿色是对黄色在进行向下平移

2.Mosaic data augmentation

将四张不同的图片按照一定规则拼接在一起，拼接好之后得到一张新的图片，能够扩充训练样本的多样性。

3.IoU threshold(match posotive samples)

https://blog.csdn.net/qq_37541097/article/details/123229946

4.Optimizered Anchors

对anchors进行优化，但yolov5使用的还是yolov3

5.CIOU

这个在之前讲过啦

咕噜咕噜开心加油

关注

18
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。