YOLO V1的过程解读

YOLO V1是一种目标检测方法,通过将图像划分为网格并预测每个网格的边界框和类别概率。每个对象仅由一个网格负责,损失函数包括坐标、置信度和类别损失。在测试阶段,网络输出的边界框经过NMS处理以减少冗余。YOLO V1在速度上有优势,但在处理多目标和小物体时表现不佳。
摘要由CSDN通过智能技术生成

you only look once!!!

一、所需基本姿势

1、YOLO将图片分成S*S的grid cell,每个grid cell对应B个bounding box,论文S=7,B=2,故有98个bbox。

2、YOLO中每一个Object只对应一个中心点,该中心点只唯一出现在一个grid cell中

3、Object中心点落在的那个grid cell负责把该Object回归出,彻底不是选取proposal再看看这个合不合适的模式

 

二、TRAINING

如图输入为448*448*3,经过类似GoogLenet的只有1*1和3*3的卷积后,得到7*7*30的feature,显然7*7对应每一个grid cell,而30个channel呢?

 

 

如图,30个channel对应2个bbox的5个位置信息和confidence,confidence是它是否是Object的概率乘上最大的IoU(当有Object的中心点在该grid cell上,则Pr(Object)=1,否者为0);再加上20个class的feature。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值