Yolov3-学习记录

YOLOv3是针对目标检测的深度学习算法,以其速度和准确性著称。该模型采用Darknet-53架构,通过多尺度预测增强检测精度,每个边界框使用独立的逻辑回归进行物体性分数预测。尽管尝试了如线性预测、focalloss和双IOU阈值等改进,但并非所有实验都提高了性能。
摘要由CSDN通过智能技术生成

引入:本次学习内容基本来自于Joseph Redmon, Ali Farhadi编写的的《YOLOv3: An Incremental Improvement》,以及部分讲解视频,本学习记录仅为个人学习收获,部分内容存在纰漏烦请各位大佬批评指正。
(一)摘要:YOLOv3是一种基于深度学习的目标检测算法,具有快速和准确的特点。其原始论文"YOLOv3: An Incremental Improvement"介绍了该算法的改进和优化。YOLOv3采用了Darknet-53网络架构,并引入了多尺度预测机制以提高检测精度。

(二)发表时间:2018

(三)关键词:目标检测,卷积神经网络,单阶段检测

(四)学习记录:

YoLov3只是相对于以前的版本进行了一些细小的改变,比以往更准确,但网络整体会大一点。

YOLOv3使用逻辑回归为每个边界框预测一个物体性分数。

YoLov3不适用softmanx函数,而是简单地使用独立的逻辑回归分类器。在训练过程中,则是对类别预测使用二元交叉熵损失。同时,YoLov3会从三个不同尺度上生成预测框。因为在每个尺度上预测3个边界框,所以该张量的大小为N × N × [3 * (4 + 1 + 80)],其中4个是边界框的偏移量,1个是物体性预测,80个是类别预测。

YOLOv2中使用的Darknet-19网络和新颖的残差网络技术的混合方法。网络使用连续的3×3和1×1卷积层,但现在还添加了一些shortcut连接,并且规模更大。它有53个卷积层,称之为Darknet-53!

在改进了网络结构的基础上,作者也做出了许多尝试,例如用线性方法预测x,y的偏置,但是结果是精度下降了。使用focal loss,精度也下降了。如果学FasterRCNN那样使用双IOU阈值,但是效果也不好。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值