YOLO v1,v2,v3总结

本文详细介绍了YOLO(You Only Look Once)的目标检测算法,从v1到v3的演进过程。YOLOv1通过直接回归目标框和置信度得分实现快速检测,但对小目标和背景处理不足。YOLOv2引入批次归一化,拼接不同尺度特征,使用anchor box提升小目标检测效果。YOLOv3则采用多逻辑分类器和FPN网络,进一步增强小目标检测和类别预测能力。
摘要由CSDN通过智能技术生成

YOLOv1

相比于两步法,yolo v1用网络直接回归出目标框和框置信度得分并对类别进行分类,没有提取建议区域的步骤,比两步法更快(可以将yolo v1看作是faster rcnn中的RPN网络的高精度版)。
从另一种角度理解,yolov1将图像分为了77共49个grid,输出的张量为77*30,分别对应每个grid,这其实就是粗暴地将划分出地grid作为建议区,然后执行两部法的第二部对其进行回归和分类。
在这里插入图片描述

在这里插入图片描述
上图为对应某grid cell的输出张量,对应输出内容,损失函数分为框置信度损失、框定位损失和分类损失,损失函数如下图所示:
在这里插入图片描述
计算损失前首先根据标签确认是前景还是背景,如果是背景,则只计算置信度损失;如果是前景,则继续计算定位损失和分类损失。但这个损失计算的方式存在一个问题,那就是无法应对背景较多的情况,因为当背景较多时,置信度损失在反向传播的过程中占据了较大的比重,往往会影响到定位损失和分类损失的反向传播,尽管作者对置信度损失乘了一个小于1的系数,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值