YOLO论文思路简析

YOLO(You Only Look Once)是2016年提出的一种快速目标检测算法,它将检测视为回归问题,实现了端到端的检测。YOLO速度快,适用于实时场景,但在小目标检测上表现不佳。网络结构简洁,通过全卷积层和全连接层预测bbox和概率。损失函数结合定位和分类误差,采用不同权重调整训练稳定性。YOLO网络的学习率随训练迭代动态调整。
摘要由CSDN通过智能技术生成

YOLO(You Only Look Once: Unified, Real-Time Object Detection)是一种2016年提出的用于视觉检测的算法,与之前的算不同,YOLO改变了检测的过程将检测转化为了一个回归问题,输出目标的bbox和p(概率)。相较于之前的算法,YOLO的执行速度很快,base YOLO可以达到45fps而fast YOLO可以达到155fps,基本可以满足实时的检测和输出,延时也将小于25ms。从结果上看,YOLO的局部检测效果较差,但也很少出现FP现象,同时YOLO对于大型目标的检测相对效果好且不易误判为背景。(对于检测结果存在四种可能:TP,FP,FN,TN)
YOLO的设计思想来源于人眼的单次观看识别,将图像整体作为YOLO的输入,经过resize,run cnn,NMS三个步骤即可得到输出。
图片摘自原文
网络特点:1.由于网络的结构十分简单,因此网络的识别速度很快,相较于同期的实时算法YOLO达到了两倍以上的准确率。
2.由于检测以整个图像作为输入,内部数据联系紧密,降低了背景的错误识别。
3.网络的适应性较好,在测试集与训练集不完全一致时仍能有较好效果。

网络将采用来自整张图片的特征同时对所有的目标进行检测和bbox预测,网络是一种端到端的结构,对于输入的图片可以直接输出bbox和p。对于输入图片将划分成SS个网格区域,检测目标的中心与所在网格关联。每个划分的网格都将产出B个bbox和score&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值