深度学习目标检测YOLO算法,带你快速了解

深度学习目标检测YOLO算法,带你快速了解

Yolo系列的模型,更新迭代速度可以称得上是内卷之王了,目前已经有了V8的版本。在论文审稿人心中的理想人选必然得是紧跟学术发展潮流的,只知道V1-V4的改进点稍显逊色,本篇就来总结下V5-V7版本的改进点,让你只看一次,便可在面对科研论文时胸有成竹!

YoloV5在V4的基础上,又做了以下改进:

  1. Focus模块:

先间隔完成分块任务,将图像特征重排,在通道维度拼接后再走卷积操作,减少网络层数和计算量,对速度有一定提升。

  1. BottleneckCSP:将CSP结构与残差连接巧妙结合,与V4版本的CSPNet结构类似,直观来看是双层残差结构的嵌套,但卷积层的具体参数,二者的内部实现稍有不同。

  1. FPN+PAN:特征融合的更加细致,上采样与下采样的多次拼接,进一步支撑小目标检测。

YoloV5在小目标检测上效果进一步提升,将自适应锚框计算的代码也整合到项目源码中,通过参数的灵活配置,可以得到不同复杂度的模型,源码中内置的超参数优化策略,也提升了模型的整体性能,是一份很具参考价值、可维护使用的工程性目标检测项目源码。

YoloV7在V6的基础上,又做了以下改进:

YoloV6和V7的发布时间间隔很短,V6的主要工作是围绕更好地适应GPU设备,将RepVGG的结构引用到backbone和neck中,同时对检测头进行解耦,分开了边框回归和类别分类,由于V6版本犹如昙花一现,且与V7版本有相似的改进点,所以本文重点阐述YoloV7版本的以下改进:

(1)RepVGG:重参数化的主要目的是为了加速、节省内存,由于nvidia设备对3*3的卷积核运算优化效果最好,YoloV7将不同尺寸的卷积核、BN层、短路连接层,全部转化成3*3的卷积,在推理时合并计算,大幅度节省了计算耗时。

对BN层,在计算公式上做推导、合并,最终的公式如下所示:

对1*1的卷积层和短路连接层,采用填充0的方式,构建成3*3的卷积核,其中短路连接还将卷积核参数固定成0和1。

(2)正样本分配策略:把GT的中心点上下左右偏移0.5个单位,由原来一个grid变成了三个grid,得到更多的正样本候选框。筛选候选框需要满足以下三个条件:

GT与anchor的长宽比例要在0.25-4之间

计算IOU损失,动态匹配topk。先按大小顺序排列取前topk个,但容易出现topk中iou数值有断崖式下降的情况,所以做累加和,做一个向下的截断,自适应topk个样本。

计算类别预测损失

(3)相对位置预测:与正样本分配策略中的中心点偏移、长宽比例筛选条件相呼应。

(2)辅助的输出头:每个输出头都对应增加一个辅助头,但仍然利用主头的预测结果来指导选择正样本,由粗到细地引导标签分配策略。

YoloV7在参数量和计算量上大幅度减少,但性能仍有少量的提升,整体来看,yolo系列的更新迭代,除了自身结构特色的优化外,也融进了很多通用性的技巧,这些可移植的改进点非常值得我们去细化总结、参考借鉴。

结尾语:

当你论文找不到创新点、实际项目没有提升思路,看看yolo系列就能让你在短时间内吸收诸多的实用技巧,灵感和思路也就应运而生了。yolo系列也是最常见的探讨话题,可以称得上是人工智能方向的基础送分题了,掌握扎实的基础上,再加上扩展和自己的总结理解,逻辑清晰地表达观点、形成共鸣和讨论,这样的文章审稿人很难不记住你!

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值