YOLO的网络结构(一)

本文介绍了YOLO的网络结构,分为图片输入、Darknet-53基础网络和三个检测分支。Y1、Y2、Y3分别针对不同大小的目标检测,通过上采样和特征拼接实现。通道数255对应类别数、坐标和置信度。网络结构中包含卷积块、残差块和上采样操作。此外,文章还讲解了卷积层的工作原理、步长和填充,以及池化层和全连接层的作用。
摘要由CSDN通过智能技术生成

YOLO的网络结构(一)

其网络结构能分为三部分。
第一部分:图片的输入
第二部分:基础网络。作者原文使用的是 Darkjnet-53 without FC layer。
第三部分:yolo v3的三个分支。y1(13x13x255),y2(26x26x255),y3(52x52x255)。

Y1从上面结点获取。是最高层的,最抽象的特征。适合比较大的目标检测;
Y2是在Y1的基础上做一个上采样+一个低层的一个特征进行连接(concat)。
适合中等的目标检测;
Y3是在Y2的基础上做一个上采样+一个更低层的一个特征进行连接(concat)。适合小 目标的检测。

三个尺度的输出皆是奇数,使得网格会有个中心位置。

通道数255:{[80(coco数据集共有80类)+[X+Y+W+H+Confiderce]}×3(anchor) = 255

在这里插入图片描述

CBL为卷积块:由conv2d,Batch Normalization,Leaky relu 这三个网络层组成。
Res为残差块:包含两个卷积块和一个add层,add层只是将相同维度的张量进行相加。
ResX为多个残差块,X代表残差块的个数。
上采样;将特征图的宽和高变成原来的两倍,通道数不变。
Concat张量拼接:相同宽和

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值