YOLOv4网络详解

原视频来自B站UP主霹雳吧啦Wz

YOLOv4网络详解_哔哩哔哩_bilibili

YOLOv4:Optimal Speed and Accuracy of Object Detection(目标检测得最佳速度和精度)

网络结构:

  • Backbone:CSPDarknet53
  • Neck:SPP,PAN
  • Head:YOLOv3

优化策略:

  • Eliminate grid sensitivity
  • Mosaic data augmentation
  • Iou threshold(match posotive samples)
  • Optimizered Anchors
  • CIOU

 CSPDarknet53的优点:

1.增强了CNN的学习能力,加快了网络的推理速度

2.移除了计算的瓶颈

3.降低显存的使用

网络结构-SPP

Spatial Pyramid Pooling(空间的金字塔池化)

能在一定程度上解决多尺度的问题

 网络结构-PAN

Path Aggregation Network(路径聚合网络)

(a)FPN特征金字塔结构,将高层的语义信息与低层进行融合。

(b)与FPN相反,将低层的语义信息与高层融合

将(a),(b)两个模块合在一起就是PAN

YOLOv4的网络结构

注意: 同样的shape(宽、高、深度)才能进行contact(按深度进行拼接)操作

优化策略-Eliminate grid sensitivity(消除网格敏感度)

 优化策略-Mosaic data augmentation (马赛克数据增强)

将4张不同的图片按照一定的规律拼接在一起 ,扩充训练样本的多样性

优化策略-IoU threshold(match positive samples) 匹配正样本的IoU阈值 

 YOLOv3中每一个grid cell生成3个anchor 模板(Template)

如果多个AT达到阈值,则都作为正样本,来增加正样本的数量。

将中心点所在的grid cell上边和左边的网格的AT2都作为正样本,进一步扩充正样本的数量

 

 优化策略-Optimizered Anchors(优化anchor)

 优化策略-CIOU

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
YOLOv4是一种高效的目标检测算法,具有极高的实时性能和较低的计算复杂度。其网络结构主要由三个部分组成:骨干网络、特征金字塔和检测头。 首先是骨干网络YOLOv4采用了CSPDarknet53作为其骨干网络,相比于以往的Darknet53,CSPDarknet53通过引入CSP(Cross Stage Partial)结构来提升网络的性能。CSP结构将输入特征图分为两部分,并在其中一部分上进行卷积操作,然后将结果与另一部分进行串联操作,这样可以减少计算量并保持信息传递的完整性。 其次是特征金字塔,特征金字塔由四个不同尺寸的特征图组成,分别用于检测不同大小的目标。为了生成这个金字塔,YOLOv4引入了Panet结构,即特征金字塔网络。Panet结构通过上采样和融合操作,将不同尺度的特征图进行融合,以便在不同尺度上进行目标检测。 最后是检测头,YOLOv4采用了三个并行的检测头,分别预测不同尺度的目标框。每个检测头输出相应的目标框、置信度和类别信息。为了提高检测精度,YOLOv4还使用了多尺度训练和数据增强技术,并引入了CIoU损失函数来优化边界框的预测。 总的来说,YOLOv4网络结构的设计充分考虑了骨干网络、特征金字塔和检测头的协同作用,通过引入CSP结构和Panet结构,以及采用多尺度训练和数据增强等策略,使得YOLOv4在目标检测任务上表现出了较高的准确性和实时性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值