飞桨PaddlePaddle零基础深度学习实践之YOLO-V3算法简介

最新推荐文章于 2024-01-30 00:13:27 发布

啃竹子的熊猫

最新推荐文章于 2024-01-30 00:13:27 发布

阅读量1.1k

点赞数

本文链接：https://blog.csdn.net/weixin_46247024/article/details/108294495

版权

本文介绍了YOLO-V3的模型设计思想，包括候选区域的产生、特征提取以及预测框的位置和类别的计算。通过Darknet53作为骨干网络，利用损失函数对网络进行训练。后续将展开更多细节。

摘要由CSDN通过智能技术生成

最近参加了《百度架构师手把手带你零基础实践深度学习》21天课程，对老师讲的YOLO-V3做一下简单梳理：
YOLO-V3 模型设计思想
YOLO-V3算法的基本思想可以分成两部分：
（1）按一定规则在图片上产生一系列的候选区域，然后根据这些候选区域与图片上物体真实框之间的位置关系对候选区域进行标注。跟真实框足够接近的那些候选区域会被标注为正样本，同时将真实框的位置作为正样本的位置目标。偏离真实框较大的那些候选区域则会被标注为负样本，负样本不需要预测位置或者类别。
（2）使用卷积神经网络提取图片特征并对候选区域的位置和类别进行预测。这样每个预测框就可以看成是一个样本，根据真实框相对它的位置和类别进行了标注而获得标签值，通过网络模型预测其位置和类别，将网络预测值和标签值进行比较，就可以建立起损失函数。

产生候选区域
如何产生候选区域，是检测模型的核心设计方案。目前大多数基于卷积神经网络的模型所采用的方式大体如下：
按一定的规则在图片上生成一系列位置固定的锚框，将这些锚框看作是可能的候选区域。
对锚框是否包含目标物体进行预测，如果包含目标物体，还需要预测所包含物体的类别，以及预测框相对于锚框位置需要调整的幅度。

卷积神经网络提取特征
YOLO-V3算法使用的骨干网络是Darknet53。Darknet53网络的具体结构如图16 所示，在ImageNet图像分类任务上取得了很好的成绩。在检测任务中，将图中C0后面的平均池化、全连接层和Softmax去掉，保留从输入到C0部分的网络结构，作为检测模型的基础网络结构，也称为骨干网络。YOLO-V3模型会在骨干网络的基础上，再添加检测相关的

最低0.47元/天解锁文章

啃竹子的熊猫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
飞桨PaddlePaddle零基础深度学习实践之YOLO-V3算法简介

这飞桨PaddlePaddle零基础深度学习实践之目标检测里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markd
复制链接

扫一扫