理解 YOLOV1 第一篇 预测阶段

首先看YOLOV1的网络结构,感觉就是普通的卷积神经网络:

  最终输出是一个7*7*30的黑盒子,把它想象成一本7*7大小的有着30页的一本书。

 书的每一页,由49个方格(grid cell)组成, V1版本中每个grid cell预测2个选框(bounding box,bounding box的中心落于该gridcell)所以一共可以生成98个bounding box。

每个bounding box,含5个参数:

1  x,y  bounding box的中心点的位置

2 h,w  bounding box的宽高

3 c 是否包含目标物体的置信度(这个置信度,应该就是交并比)

视角在切回grid cell,grid cell还包含每个类别的概率,用grid cell的类别概率,乘以grid cell自己生成的bounding box的置信度,就获得该bounding box对应各个类别的概率。

这样的话,过滤掉概率低的,这个含有位置信息和类别信息的框框就可以画出来了。

再次整体看看这个黑盒子:

那,刚刚我们看的是黑盒子的左视图,那刚刚也提到了每个grid cell也包含了 很多的信息。那么看这幅图的正视图将更加的清楚(及每个或者说49个grid cell都是由深度的,这个深度是30)。

这里,我们就专注看,其实一个grid cell 和它包含的深度信息:

之前讲到 ,每个grid cell可预测2个选框(bounding box),紫色和绿色就是这两个bounding box部分,每个bounding box含5个参数,没错就是上面提到的5个参数。最后20个维度存放的是该grid cell对应的20种类别的概率。看到这里我们就大概知道了。V1版本一张图片最多能生成98个选框,最多能分20种类别。

小结

为了更好的理解,这里强调几点:

  1. grid cell和bounding box是有着对应关系的:每个grid cell对应两个bounding box
  2. bounding box包含是否含有物体的置信度(这里有待进一步确认具体是什么的置信度
  3. grid cell包含每个类别的概率.
  4. 两个bounding box分别有一个置信度,如果下图所示:

 红色的框框代表grid cell,两个黑色的框框代表grid cell生成的两个bounding boxes,线越粗代表置信度越高。两个bounding box共享该grid cell类别的概率。概率和置信度相乘,将得到这个类别判断的全概率

看看这种动图,应该能更好的理解:


继续分析:如果规定每个grid中类别概率最大值涂上自己的专属颜色,那么就可能得到如下效果:

 


参考资料

【精读AI论文】YOLO V1目标检测,看我就够了_哔哩哔哩_bilibili

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
YOLOv1YOLOv8是目标检测算法中的两个版本。YOLOv1YOLO(You Only Look Once)系列算法的第一个版本,而YOLOv8是该系列算法的第八个版本及其后续版本的总称。 YOLOv1是一种实时目标检测算法,它通过将输入图像分成网格,并在每个网格中预测目标的边界和类别。与传统的目标检测算法相比,YOLOv1具有更快的速度和更高的准确性。然而,YOLOv1在小目标检测和定位精度方面存在一定的问题。 YOLOv8是YOLO系列算法的最新版本之一,它提供了五个不同的版本:YOLOv8n(纳米级)、YOLOv8s(小型)、YOLOv8m(中型)、YOLOv8l(大型)和YOLOv8x(特大型)。这些版本在网络结构和模型规模上有所区别,可以根据任务需求选择合适的版本。 此外,YOLOv8还提供了针对各个版本的预训练权重文件集合。这些预训练权重文件可以用于检测、分割和姿势估计等任务,并且是在COCO数据集上进行预训练的。使用这些预训练权重文件可以加快模型的训练速度和提高模型的性能。 总之,YOLOv1YOLOv8是目标检测算法中的两个版本,YOLOv8是YOLO系列算法的最新版本之一,提供了多个不同规模的版本和对应的预训练权重文件集合。这些算法可以用于实时目标检测任务,并具有较高的准确性和较快的速度。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [从YOLOv1YOLOv8的YOLO系列最新综述【2023年4月】](https://blog.csdn.net/daydayup858/article/details/130018935)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] - *3* [YOLOv8预训练权重文件集合(YOLOv8n,YOLOv8s,YOLOv8m,YOLOv8l,YOLOv8x)](https://download.csdn.net/download/crasher123/87941630)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

code bean

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值