目标检测(7)—— YOLO系列V3

一、YOLOV3

在这里插入图片描述
在这里插入图片描述

  • 多scale

三种scale:
为了检测到不同大小的物体,设计了3个scale。
特征融合不好。
感受野大的特征图预测大的,中的预测中的,小的预测小的。各自预测各自的,不用做特征融合。
三个候选框:
每个特征图三个候选框。

在这里插入图片描述
怎么得到大中小的特征图?
不能单独拎出来,要两两进行联系,做一些特征融合。

这两不适合YOLO:
在这里插入图片描述

右图是YOLOV3的核心思想:

13×13做一个上采样(插值),变成26×26,跟中间的26×26进行融合。
26×26做一个上采样(插值),变成52×52,跟最前面52×52进行融合。

在这里插入图片描述

  • 残差连接

在这里插入图片描述
我们都知道,网络越深,效果越差。
采用残差连接,两种方案,效果更差的话,就把残差块学成0,使用一致性映射x。残差肯定不会原来的差。

核心的网络架构

  • 池化也不要了,特征图怎么变成原来的1/2?需要下采样的时候卷积层的stride=2
  • 残差网络那篇论文的残差块没有池化层,之前看竟然没有发现。。。
  • 得到感受野大的特征图13×13×75(用作提取大的),将13×13×1024做上采样,变成26×26×256(这个用作特征融合)
  • 26×26×256与26×26×512进行特征融合,得到26×26×768,降采样得到26×26×256(这个用作特征融合),最后得到中的特征图26×26×75
  • 26×26×256上采样得到52×52×128,与52×52×256特征融合得到52×52×384,最后得到小的特征图52×52×75
  • 75会变,看你输入图片的大小

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 先验框设计

V2中用聚类给预测5个,V3先分三类。
在这里插入图片描述
在这里插入图片描述

  • softmax层的改进

在这里插入图片描述
softmax不能做多标签的分类,V3做的也不是多标签的分类,而是对每一个类别进行二分类。如下:
判断是个猫的概率是0.8,是个狗的概率是0.2。。。。
设置一个阈值,比如是0.7,大于0.7的则属于这个类。

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

莫听穿林打叶声@

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值