目标检测:YOLOV3技术详解

YOLOV3是YOLO系列的升级,采用了DarkNet53网络结构,结合FPN思想进行特征融合。文章介绍了CBL、ResUnit和ResX模块,以及网络如何利用不同尺寸的featuremap检测不同大小的目标。新的分类器采用softmax二分类处理相关类别。在正负样本匹配上,设置了IOIU阈值来确定样本标签,但在某些实现中,这种策略可能会导致正样本不足。损失函数部分也有所调整。
摘要由CSDN通过智能技术生成

前言

YOLOV3是V2的升级版,也是原作者的绝笔,V3主要还是把当时一些有用的思想融入了进来,没有什么创新型的突破,具体细节我们下面介绍。

主要改进

DarkNet53

从yolov2的darknet19 转换为了新的darknet53,主要借鉴了FPN的思想,引入了多个感受野的特征融合,具体如下图:

在这里插入图片描述

CBL模块:卷基层+BN层+Leaky relu激活函数
ResUnit模块:两个CBL层+残差连接
ResX模块:CBL模块+ X个ResUnit模块

Concat:代表channel维度的叠加(就好比高中时期课代表收作业,最终会抱着很高的作业,把每一本作业必做一个feature map,那么这个作业本堆叠的过程就叫concat)。

网络输出3个大小不同feature map,这三个的感受野不同,作者用他们分别负责识别不同大小的目标,作者在聚类挑选anchor的时候,分成9个cluster,最小的三个尺度划分给 hw为76的feature,以此类推。

新的分类器

由于 COCO数据集的类别从20增加到80,会有很多类似的类别,比如说男人于女人,他们虽然可以看成两类,但是本身也有联系,而Softmax分类器假设的是所有类别互不相关,所以作者对每一个类别改用softmax的二分类。

正负样本的匹配

作者设定了两个IOIU阈值,假设为0.5,0.3,表示如果anchor与ground truth的IOU大于等于0.5或者是anchor中IOU最大的,则设定为正样本,小于0.3的设定为负样本,然而大于0.5却不是IOU最大的则直接丢弃。

然而在Ultralytics版本的代码中,没有采取这个策略,因为会造成正样本不足。

损失函数

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

HanZee

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值