Keras YOLOv3代码详解（二）：目标检测原理解析

最新推荐文章于 2023-06-08 15:56:49 发布

闪闪·Style

最新推荐文章于 2023-06-08 15:56:49 发布

阅读量1w

点赞数 21

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41943311/article/details/95457375

版权

本文介绍了YOLOv3的检测过程，包括输入图片的处理、网络输出的解释，以及anchor box、中心坐标、边框、目标分数和类别置信度的详细说明。通过非极大值抑制筛选有效检测框，解释了YOLOv3如何利用预定义的anchor box进行目标检测。

摘要由CSDN通过智能技术生成

我们上周分析了darknet53的网络结构，并使用Netron工具查看，搞清楚darknet53是一个具有252层的网络，并在13x13、26x26、52x52三个尺寸上输出3张特征图（featue maps），具体内容请参考：

Keras YOLO v3代码详解（一）：darknet53网络结构分析+Netron工具

本周，我们进一步研究YOLOv3是怎样检测图片内容的，在这篇文章和下一篇文章中，我们先不研究如何训练YOLOv3的darknet53网络，而是先看一看使用已经训练好的YOLOv3模型，相应的Python程序时如何完成图片中的目标检测的。

这篇文章的主要内容是介绍YOLOv3的目标检测原理，下一篇文章详细解读目标检测的代码部分。

这篇文章的内容主要包括6部分内容，分别是：（一）检测过程、（二）anchor box、（三）中心坐标和边框、（四）目标分数、（五）类别置信度、和（六）输出处理。

（一）检测过程

YOLOv3的图像检测过程大致如下：

（1）输入一张任意大小图片，保持长宽比不变的情况下，缩放至 w 或 h 达到416，生成416x416的新图，作为网络的输入input。即网络的输入是一张416x416、3通道的RGB图片。

（2）运行网络。YOLOv3的卷积神经网络（CNN）网络的输出把图片分成NxN个网格（YOLOv3多尺度预测，输出有3层featue maps，每层feature map有NxN个网格，分别为13x13 、26 x26 和52x52），然后每个网格负责去检测那些中心点落在该格子内的目标。下图是在一个13x13的feature map中对小狗进行识别：

最低0.47元/天解锁文章

关注

21
点赞
踩
88

收藏

觉得还不错? 一键收藏
0
评论
Keras YOLOv3代码详解（二）：目标检测原理解析

我们上周分析了darknet53的网络结构，并使用Netron工具查看，搞清楚darknet53是一个具有252层的网络，并在13x13、26x26、52x52三个尺寸上输出3张特征图（featue maps），具体内容请参考：Keras YOLO v3代码详解（一）：darknet53网络结构分析+Netron工具本周，我们进一步研究YOLOv3是怎样检测图片内容的，在这篇文章和下...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。