YOLO-V4 论文学习+唐宇迪博士课程学习笔记

最新推荐文章于 2024-05-28 16:29:42 发布

Mechantronic Bao

最新推荐文章于 2024-05-28 16:29:42 发布

阅读量322

点赞数

分类专栏：目标检测深度学习文章标签：深度学习计算机视觉人工智能目标检测神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/whb78952/article/details/128666561

版权

深度学习同时被 2 个专栏收录

4 篇文章 1 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

论文主要贡献：
1.利用单GPU即可训练一个目标检测器.
2.验证了Bag-of-Freebies 和 Bag-of-Specials方法在训练目标检测器当中的作用。
3.对包括CBN、PAN、SAM在内的现有方法进行了改进。

数据增强:
1.Mosaic数据增强
参考CutMix将四张图像（每张各自进行数据增强）拼接成一张进行训练：
在这里插入图片描述
2.SAT数据增强（Self-adversarial-training自对抗训练）

损失函数：
1.IOU Loss：实际和预测框无相交即IOU=0时无法进行梯度计算，且相同的IOU对应多种框的相对位置，无法反应实际情况。
2.GIOU：引入了最小封闭形状C可以把A和B包括在内，优点在于在A框B框不重叠的情况下可以使得预测框向真实框逼近，缺点不足在于A和B重叠情况下GIOU又无法评价好坏了。
在这里插入图片描述

3.DIOU：式中分式分子为预测框与真实框的中心点欧式距离，式中分母为可以覆盖A和B两框的最小BOX对角线长度。优点在于直接利用距离计算，速度更快解决了GIOU的问题。
在这里插入图片描述

4.YOLO V4选用CIOU作为损失函数：损失函数必须考虑重叠面积、中心点距离与长宽比，用v代表长宽比用α代表权重参数。
在这里插入图片描述

SAM空间注意力机制：

在原始SAM基础上，把经过池化再卷积的过程改为一次卷积。
在这里插入图片描述

PAN:

原有特征融合都是加法操作，现在改为拼接操作，虽然特征更多但可以提升精度。
在这里插入图片描述

Mish激活函数：
相比Relu激活函数，计算量增加，效果提升一点
在这里插入图片描述

公式：
在这里插入图片描述

整体网络架构：

在这里插入图片描述

Mechantronic Bao

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
YOLO-V4 论文学习+唐宇迪博士课程学习笔记

YOLO-V4学习笔记
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。