Yolov3-学习记录

羊村第一突破手懒羊羊

已于 2023-07-25 10:49:35 修改

阅读量31

点赞数

文章标签：计算机视觉人工智能

于 2023-07-25 10:48:52 首次发布

本文链接：https://blog.csdn.net/lzf767801/article/details/131912831

版权

YOLOv3是针对目标检测的深度学习算法，以其速度和准确性著称。该模型采用Darknet-53架构，通过多尺度预测增强检测精度，每个边界框使用独立的逻辑回归进行物体性分数预测。尽管尝试了如线性预测、focalloss和双IOU阈值等改进，但并非所有实验都提高了性能。

摘要由CSDN通过智能技术生成

引入：本次学习内容基本来自于Joseph Redmon, Ali Farhadi编写的的《YOLOv3: An Incremental Improvement》，以及部分讲解视频，本学习记录仅为个人学习收获，部分内容存在纰漏烦请各位大佬批评指正。
（一）摘要：YOLOv3是一种基于深度学习的目标检测算法，具有快速和准确的特点。其原始论文"YOLOv3: An Incremental Improvement"介绍了该算法的改进和优化。YOLOv3采用了Darknet-53网络架构，并引入了多尺度预测机制以提高检测精度。

（二）发表时间：2018

（三）关键词：目标检测，卷积神经网络，单阶段检测

（四）学习记录：

YoLov3只是相对于以前的版本进行了一些细小的改变，比以往更准确，但网络整体会大一点。

YOLOv3使用逻辑回归为每个边界框预测一个物体性分数。

YoLov3不适用softmanx函数，而是简单地使用独立的逻辑回归分类器。在训练过程中，则是对类别预测使用二元交叉熵损失。同时,YoLov3会从三个不同尺度上生成预测框。因为在每个尺度上预测3个边界框，所以该张量的大小为N × N × [3 * (4 + 1 + 80)]，其中4个是边界框的偏移量，1个是物体性预测，80个是类别预测。

YOLOv2中使用的Darknet-19网络和新颖的残差网络技术的混合方法。网络使用连续的3×3和1×1卷积层，但现在还添加了一些shortcut连接，并且规模更大。它有53个卷积层，称之为Darknet-53！