YOLO系列-yolov4

最新推荐文章于 2024-04-28 15:28:18 发布

dzm1204

最新推荐文章于 2024-04-28 15:28:18 发布

阅读量525

点赞数 1

分类专栏：深度学习文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45893652/article/details/128208129

版权

深度学习专栏收录该内容

8 篇文章 1 订阅

订阅专栏

文章目录

Mosaic data augmentation
DropBlock
Label Smoothing
损失函数遇到的问题
bag of specials(bos)
SPPNet(Spatial Pyramid Pooling)
CSPNet(Cross Stage Partial Network)
CBAM
- SAM
PAN（Path Aggregation Network)
激活函数 Mish
整体网络架构

Mosaic data augmentation

yolov4可以使用单卡GPU进行训练，训练任务不能太大，将四张图片融合成一起，借鉴了cutmix的方法，由上图可以知道cutmix效果最好，这样可以提高训练效率和精准度。yolov4还有增加噪音点、随机遮掩、随机裁剪等数据增强。
在这里插入图片描述

DropBlock

之前的dropout都是随机选择点，而yolov4是吃掉一个区域

Label Smoothing

神经网络最大的缺点就是容易过拟合
原来打标签是就打1不是就打0，这样有点太绝对
为了防止网络的抗拟合能力，yolov4做了标签平滑，例如原来的标签为（0，1）[0,1] * (1 - 0.1） + 0.1 / 2 = [0.05, 0.95]
下图就是使用之前和使用之后，一个簇内更紧密一个簇内更分离
在这里插入图片描述

损失函数遇到的问题

IOU就是预测框和真实框的重叠程度
但是光凭IOU会存在一个问题，下图三个的IOU是一样的，相同的IOU却反映不出实际情况到底怎么样
在这里插入图片描述

GIOU

主要与IOU不同的是引入了最小封闭形状C，C可以把A，B包含在内
为了在不重叠的情况下能让预测框尽可能朝着真实框前进

在这里插入图片描述
但是这样还是会出现下面这种问题，这三种不同的情况IOU和GIOU都相同，所以对于GIOU还需要继续改进

DIOU

在这里插入图片描述

其中分子是计算预测框和真实框的中心点的欧氏距离d
分母是能覆盖预测框和真实框的最小BOX的对角线长度c
直接优化距离，速度更快，并解决GIOU的问题

CIOU

综合考虑了重叠面积，中心点距离，长宽比（真实值和预测值的长宽比）

bag of specials(bos)

增加稍许推断代价，但可以提高模型精度的方法
网络细节部分加入了很多改进，引入了各种能让特征提取更好的方法
注意力机制，网络细节，特征金字塔等等

SPPNet(Spatial Pyramid Pooling)

V3中为了更好的满足不同输入大小，训练的时候要改变输入数据的大小
SPP就是用最大池化来满足最终输入特征一致

CSPNet(Cross Stage Partial Network)

每个block按照特征图的channel维度拆分成两个部分
一份正常走网络，另一份直接concat到这个block的输出

在这里插入图片描述

CBAM

比如有3232256 的特征图，但是不一定每个特征图都很重要，需要给这些特征图加一个权重值，类似做一个softmax操作和计算空间点位置的权重值，然后再把这些权重值乘到原来的特征图当中，简单来说就是加入了注意力机制，已经在很多论文中常见了。

SAM

V4中用的是SAM，也就是空间注意力机制（位置部分的注意力）

PAN（Path Aggregation Network)

FPN是自顶向下的模式，将高层的特征传下来，例如resnet，总是将上一层的特征和下面的融合，这样做的缺点是没有做到自下向上的融合，而pan做的就是自低向上的路径，使得底层信息更容易传到顶部

激活函数 Mish

Relu有些绝对，Mish更符合实际
Mish是给前面学的不太好的一个机会，而不是像relu一棒子都打死

整体网络架构

在这里插入图片描述

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
YOLO系列-yolov4

yolov4可以使用单卡GPU进行训练，训练任务不能太大，将四张图片融合成一起，借鉴了cutmix的方法，由上图可以知道cutmix效果最好，这样可以提高训练效率和精准度。yolov4还有增加噪音点、随机遮掩、随机裁剪等数据增强。
复制链接

扫一扫

专栏目录

dzm1204 CSDN认证博客专家 CSDN认证企业博客

码龄5年

23: 原创

42万+: 周排名

137万+: 总排名

1万+: 访问

: 等级

263: 积分

8: 粉丝

22: 获赞

5: 评论

63: 收藏

私信

关注

热门文章

分类专栏

最新评论

ros解决同一个节点不能同时启动
boreno: 你好、再哪里修改呢
YOLO系列-yolov2
namelijink: 迪哥的视频，整理也费心了
笛卡尔空间下的机械臂路径规划算法
m0_73155415: 请问这个代码怎么用到我自己配置的moveit机械臂包中
MMLAB学习-MMCLS项目-训练自己的任务
dzm1204: 生成的配置文件里会有workdir的地址，用来保存模型和日志，仔细对照一下路径找一找
MMLAB学习-MMCLS项目-训练自己的任务
落栀星: 你好，我给config配置参数的时候并不能生成一个work_dir的文件夹，请问这个怎么解决呀 usage: train.py [-h] [--work-dir WORK_DIR] [--resume-from RESUME_FROM] [--no-validate] [--device DEVICE | --gpus GPUS | --gpu-ids GPU_IDS [GPU_IDS ...] | --gpu-id GPU_ID] [--ipu-replicas IPU_REPLICAS] [--seed SEED] [--diff-seed] [--deterministic] [--cfg-options CFG_OPTIONS [CFG_OPTIONS ...]] [--launcher {none,pytorch,slurm,mpi}] [--local_rank LOCAL_RANK] config train.py: error: unrecognized arguments: Project\\mmclassification-master\\configs\\resnet\\resnet18_8xb32_in1k.py

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

dzm1204 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。