yolov3整体工作流程（个人理解，欢迎纠正和补充）

奔跑的小仙女

已于 2022-02-17 10:45:13 修改

阅读量1.2w

点赞数 5

分类专栏：深度学习文章标签： YOLOv3整体工作流程

于 2019-10-23 20:59:09 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43211132/article/details/102710820

版权

YOLOv3通过Darknet53网络提取特征，将输入图像压缩至13×13网格，每个网格预测3个边界框。采用多尺度检测不同大小目标，输出3个特征图分别对应不同尺度。每个特征图有3个anchor，用于预测目标。分类器计算特定标签概率，使用二元交叉熵损失计算分类损失。

摘要由CSDN通过智能技术生成

以下内容纯属个人理解，请路过的小伙伴留下宝贵意见，欢迎纠正和补充，谢谢

yolov3的总体思想归纳：

首先，将输入图片压缩到416×416，通过特征提取网络（Darknet53 without FC layer）对输入图像提取特征得到大小一定的特征图，比如13×13，然后将输入图像分成13×13个网格（grid cells），接着如果GT中某个目标的中心坐标落在哪个grid cell中，那么就由该grid cell来预测该目标。每个grid cell都会预测3个边界框。预测得到的输出特征图共有三个维度，第三个维度是深度。

Yolov3输出了三个不同尺度的特征图。采用多尺度对不同大小的目标进行检测，越精细的grid cell就可以检测出越精细的物体。三个尺度的深度都是255（3×（5+80））。

根据图来说明过程：

最低0.47元/天解锁文章

奔跑的小仙女

关注

5
点赞
踩
60

收藏

觉得还不错? 一键收藏
7
评论
yolov3整体工作流程（个人理解，欢迎纠正和补充）

以下内容纯属个人理解，请路过的小伙伴留下宝贵意见，欢迎纠正和补充，谢谢yolov3的总体思想归纳：首先，将输入图片压缩到416×416，通过特征提取网络（Darknet53 without FC layer）对输入图像提取特征得到大小一定的特征图，比如13×13，然后将输入图像分成13×13个网格（grid cells），接着如果GT中某个目标的中心坐标落在哪个grid cell中，那么就...
复制链接

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。