目标检测（7）—— YOLO系列V3

最新推荐文章于 2024-05-16 11:49:19 发布

莫听穿林打叶声@

最新推荐文章于 2024-05-16 11:49:19 发布

阅读量870

点赞数

分类专栏：目标检测文章标签：目标检测计算机视觉深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45703331/article/details/127719754

版权

目标检测专栏收录该内容

9 篇文章 7 订阅

订阅专栏

一、YOLOV3

在这里插入图片描述

多scale

三种scale：
为了检测到不同大小的物体，设计了3个scale。
特征融合不好。
感受野大的特征图预测大的，中的预测中的，小的预测小的。各自预测各自的，不用做特征融合。
三个候选框：
每个特征图三个候选框。

在这里插入图片描述
怎么得到大中小的特征图？
不能单独拎出来，要两两进行联系，做一些特征融合。

这两不适合YOLO：
在这里插入图片描述

右图是YOLOV3的核心思想：

13×13做一个上采样（插值），变成26×26，跟中间的26×26进行融合。
26×26做一个上采样（插值），变成52×52，跟最前面52×52进行融合。

在这里插入图片描述

残差连接

在这里插入图片描述
我们都知道，网络越深，效果越差。
采用残差连接，两种方案，效果更差的话，就把残差块学成0，使用一致性映射x。残差肯定不会原来的差。

核心的网络架构

池化也不要了，特征图怎么变成原来的1/2？需要下采样的时候卷积层的stride=2
残差网络那篇论文的残差块没有池化层，之前看竟然没有发现。。。
得到感受野大的特征图13×13×75（用作提取大的），将13×13×1024做上采样，变成26×26×256（这个用作特征融合）
26×26×256与26×26×512进行特征融合，得到26×26×768，降采样得到26×26×256（这个用作特征融合），最后得到中的特征图26×26×75
26×26×256上采样得到52×52×128，与52×52×256特征融合得到52×52×384，最后得到小的特征图52×52×75
75会变，看你输入图片的大小

在这里插入图片描述

先验框设计

V2中用聚类给预测5个，V3先分三类。
在这里插入图片描述

softmax层的改进

在这里插入图片描述
softmax不能做多标签的分类，V3做的也不是多标签的分类，而是对每一个类别进行二分类。如下：
判断是个猫的概率是0.8，是个狗的概率是0.2。。。。
设置一个阈值，比如是0.7，大于0.7的则属于这个类。

在这里插入图片描述

莫听穿林打叶声@

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
目标检测（7）—— YOLO系列V3

YOLOV3
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

莫听穿林打叶声@ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。