论文笔记:YOLOv4

最新推荐文章于 2022-12-19 14:55:00 发布

龙骑士尹志华

最新推荐文章于 2022-12-19 14:55:00 发布

阅读量2k

点赞数 2

本文链接：https://blog.csdn.net/stezio/article/details/105992198

版权

本文详细介绍了YOLOv4的网络结构，包括CSPDarknet53、SPP模块和PANet的整合，以及BoF和BoS的选择。作者探讨了不同组件对检测性能的影响，如DropBlock、SyncBN和SAT等，并展示了实验结果，证明了这些优化策略在保持计算效率的同时提高了检测准确性。

摘要由CSDN通过智能技术生成

说起来难受，自己的东西一直拖到YOLOv4出来了，唉。

作者在related work中做了个综述，包括：1.网络模型； 2.不增加前传时间但提点的tricks(bag of freebies)； 3.略微增加前传时间但提点较大的tricks(bag of specials)。因为是综述这里就不一一罗列了。有一点值得一提的就是在进行网络模型分类的时候作者把一阶段网络称为"dense prediction",二阶段网络称为"sparse prediction"。这种说法比较少见但想想确实也合理。因为一阶段网络是对每个feature点都要做分类和回归，而二阶段网络在找出roi之后进行分类和精回归。如果把二阶段网络的第一阶段与一阶段网络直接相比的话，少了具体分类的部分，在这里只有前景和背景一说。

网络结构

作者称，对于分类的最优参考模型对于检测并不一定是最优的，detector需要以下几点特性：
1.更高的输入网络尺寸用于检测多重小目标
2.为了覆盖更高的输入尺寸，使用更多的层已获得更大的感受野
3.更多的参数，以更好地在单一图像中检测不同尺度的物体

基于此CSPDarknet53以更多的3*3卷积(29:16)获得了比CSPResNext50更大的感受野。
在这里插入图片描述
作者将不同大小的感受野的影响总结如下：
1.上升到目标大小，获得整个目标的视野
2.上升到网络大小，能够学习到目标周围context信息
3.溢出网络大小，增加图像和最终激活