YOLO V3 网络结构理解

目录

 

yolov3部分网络结构图

yolo v3每层的输入输出大小

最直观的yolo v3结构图

yolov3细节点


yolov3部分网络结构图


 输入大小608*608

yolov3开头结构

 

第一个yolo层

 

第二个yolo输出层

 

第三个yolo输出层

 


yolo v3每层的输入输出大小

以下图片来自  https://blog.csdn.net/zw__chen/article/details/84322511

输入图片大小416*416

 第一层yolo: 13*13*255       255 = (4+1+80)*3 = 85*3

第二层yolo: 26*26*255

第三层yolo: 52*52*255


最直观的yolo v3结构图

以下图片来自博客  https://blog.csdn.net/zw__chen/article/details/84322511


yolov3细节点

yolov3 = Resnet + darknet-53 + FPN

输入图片大小:416*416

32倍下采样:   13*13

16倍下采样:   26*26

 8倍下采样:    52*52

采用多尺度预测

每个尺度三种大小的锚点:一共有9种锚点(3*3)

每个特征图网格预测3个bbox    每个网格输出的维度为(4+1+80)bbox坐标+ bbox conf + class score

 

由于检测是在三个尺度上进行的,预测图的维度是不同的。虽然三个特征图的维度不同,但对它们执行的输出处理过程是相似的。测试的时候会做相应的工作将三个尺度的输出结果组合为单个张量

最终预测单张图像时,网络输出的维度为:1×10647×85

第一个维度为批量大小

第二个维度表示预测框的个数:10647 = (52*52 + 26*26 + 13*13)*3

第三个维度表示每个BBOX的信息:85  = (4+1+80)(4 个边界框属性、1 个 objectness 分数和 80 个类别分数)

 

 

 

 

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值