YOLOv3模型原理深度解析

概况

(1)YOLOv3是YOLO系列第一次引入残差连接来解决深度网络中的梯度消失问题(是不是第一次,有待你后面考证),实际用的backbone是DarkNet53

(2)最显著的改进,也是对你涨点贡献最大的一个原因:在三个尺度上,以相同的方式进行目标检测。你别管它是怎么实现的,反正对大目标、小目标和中目标,他都有一定的鲁棒性。

(3)将损失函数从以前的Softmax修改为Logit,也就是对每个类别进行了一个解耦

(4)在最后推理阶段,对3个检测层的预测结果进行了 非最大抑制 NMS

下图左上角粉色的那个网络就是展现着,“引入残差连接”

下图下方那三张大小,由“小”、“中”、“大”的小狗的图片表示的是“对于三个尺寸不同的目标使用相同的方式进行目标检测”

通过下面这个模型速度与精度的示意图,可以看出YOLOv3从速度上远远快于同期的其他模型。 

一、Backbone上使用DarkNet53 

Backbone改进后效果如何?

YOLOv3的backnone是DarkNet53。
——对比DarkNet19可以发现,它比VGG16的的参数量要少(VGG16的模型文件的大小是528MB, DarkNet19的weight是80MB),速度更快了(VGG16=9.4s; DarkNet19=6.2ms),但是精度反而有上升(VGG16=90.0; DarkNet19=91.2)‘

        YOLOv2使用的backbone是DarkNet19’

        这里DarkNet19为什么参数量降低了这么多?因为VGG中最后一节组件Fully Connected全连接层占用了大量参数。DarkNet19将Fully Connected这一层替换成了别的,所以参数量才降低的这么明显。

——ResNet101和DarkNet53都具有残差结构。但是DarkNet53相比ResNet101,在参数量差不多的情况下(ResNet101=160MB, DarkNet53=159MB),精度高一点点(ResNet101=93.7, DarkNet53=93.7),速度更快(ResNet101=20ms; DarkNet53=13.7ms)

为什么这样改,会有效果?解释一下

 为什么DarkNet19能在减少参数量和包装速度较快的同时,保证精度较高?

       

参数量的减少速度较快归功于:首先可以看到VGG16最后几个模块是3个Fully Connect层。而右边的DarkNet19则完全抛弃掉Fully Connected这个组件,继而以1×1卷积在模型的结尾替换掉FC层的位置。FC层在这里起作用的是过渡(transition),比如你看Dark19每隔着几个套件就有一个1×1卷积,主要就是用于衔接不同组件的。

                VGG16这个图中那些出现多次数字比如512和256指的是channel数。而DarkNet19的通道数则是图中Filters这一列

        

为什么我们需要残差连接?

为什么在VGG系列和DarkNet19发布的2006年,当时的网络最深就是到19层,比如在那一年VGG系列最深就是VGG19,无法更深呢?

        何凯明在他的ResNet论文中给出的解答。网络越深,training error和testing error越来越大,精度相较于浅层网络还会有所下降。因为随着网络的加深,会出现梯度弥散(梯度消失),很多的有关特征的信息会消失在网络的更深层处,导致没法呈现最佳效果。当然在ResNet这篇文章中,作者何凯明提出了 残差连接 Residual Block的设计结构,使得网络得以突破19层这个frontier,向继续深里面扩展。

什么是残差连接?

        经过各种卷积处理过后的输出数据和没经过各种处理的原始输入数据加在一起,就是残差连接

加入残差连接的好处?

        之所以要把原始数据再加给输出数据,是因为某些特征会在经过那一堆卷积的过程中消失掉(也就是梯度消失),通过加入原始数据就可以找回丢失的特征或者丢失的信息。不用残差连接你就捕捉不到这些有用的信息或者特征,自然分数就会低。

        加入残差模型之前浅蓝色线(18层网络)的error是低于红线(34层网络)。但是一旦加入残差连接,红线里面低于浅蓝色线,深层网络的误差低于浅层网络。

既然ResNet这么好,为什么作者在YOLO

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

德彪稳坐倒骑驴

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值