YOLOv4论文解读

最新推荐文章于 2024-04-10 00:19:47 发布

Chermack

最新推荐文章于 2024-04-10 00:19:47 发布

阅读量3.6k

点赞数 4

分类专栏：深度学习-目标检测文章标签：计算机视觉神经网络机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Chermack/article/details/106746483

版权

论文原文：

https://arxiv.org/pdf/2004.10934.pdf

代码实现：

https://github.com/AlexeyAB/darknet

一、介绍

原文名称：《YOLOv4: Optimal Speed and Accuracy of Object Detection》，可以看出这是一个非常自信的题目，声称YOLOv4在目标检测具有最优的速度和准确率。相比于Joe Redmon的最终作品YOLOv3，Alexey Bochkovskiy为一作的YOLOv4确实取得了非常明显的速度和准确率的提升。笔者认为YOLOv4的提升更多的还是一些工程上的奇技淫巧，将最近几年内提出的用于其他模型的方法结合YOLO进行融汇贯通。从数据增强，模型结构和训练方法等都进行了大量的改进，通过本文也可以了解到最近一些年提出的工程上的最佳实践。
YOLOv4在MS COCO数据集上对比其他模型
上图横轴为效率，纵轴为准确率。效率和准确率都高则会在图中右上部分。在低帧率上，例如EfficientDet能够达到更高的准确率，但是就低于30FPS而言（图中非蓝色部分），达不到实时流畅的程度。所以说YOLOv4在效率和准确率上具有最佳性价比更加贴切。

二、YOLOv4改进

YOLOv4的改进内容十分丰富，但原作者在Introduction部分自述贡献主要包括以下三点：

提出了一个高效高性能的目标检测模型，确保任何人都可以使用单张传统的GPU便可以训练YOLOv4，例如1080Ti或2080Ti（相比于TITAN V 或者Tesla V100等高端显卡或多张显卡而言）。
结合最新的BoF（Bag-of-Freebies）和BoS（Bag-of-Specials）方法YOLOv4进行改进。（BoF，一袋免费的商品，比喻的是一些训练方法技巧，加入这些训练方法和技巧，并不会增加模型推理时候的开销，即在模型部署使用时并不会推理更慢或者占用更高的机器性能，但是可能会在训练时多费一些时间和功夫，加入这些方法和技巧肯定能使模型训练的更好，因此比作一袋免

最低0.47元/天解锁文章

博客等级

码龄5年

8
原创

88
点赞

298
收藏

11
粉丝

关注

私信

热门文章

分类专栏

最新评论

CUDA PYTHON 并行计算基础
m0_52197743: 讲得好清楚，太感谢了
《Attention Is All You Need》注意力机制公式中Q,K,V的理解
仙贝啊我的爱: transformer源论文中说，编码解码注意力机制的KV都来自编码器，Q来自解码器上一层，但是看你的描述怎么感觉不太一样
《Attention Is All You Need》注意力机制公式中Q,K,V的理解
UncoDong: 感谢博主，讲的很好！
《Attention Is All You Need》注意力机制公式中Q,K,V的理解
Chermack: 你好，我这里确实没有说清楚。按照我的简单理解，Attention的目的，是要将原始整个输入（X），通过计算得到一个有不同重要程度的结果（Y），文中给出的Attention计算公式可以分成两部分理解。一个是softmax函数包裹的部分（这是一个权重分布，代表的是各部分的重要程度，是一个概率值），另一个部分是V（可以看作是原始输入）。二者相乘，就是把注意力作用在原始输入上，得到一个有重要性程度区分的输出。在自注意力中，不妨理解为Q=K=V=X（输入），而实际上这4个并不相等，但Q,K,V都是输入X通过线性变换得来的。我后续有更好的理解会再写一篇文章描述。这是我的见解，如有不对的地方恳请指正
《Attention Is All You Need》注意力机制公式中Q,K,V的理解
qq_null: 请问自身的value是什么呢？就是V的含义不大清楚

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。