目标检测总结：YOLO系列（1）

最新推荐文章于 2024-06-26 21:19:32 发布

Tianlock

最新推荐文章于 2024-06-26 21:19:32 发布

阅读量649

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Tianlock/article/details/86584173

版权

YOLO系列（1）

- YOLO v1
- YOLO v2
- - Darknet

之前两篇文章介绍了two-stage 的目标检测框架，本文开始介绍 one-stage。

YOLO v1

YOLO，解决了目标检测中最大的难题：速度，它为目标检测提供了新的思路。
主要特点：1，快，2，将背景预测为前景的错误率小，3，泛化能力强。
主要思想：

将整张图作为网络的输入，直接在输出层回归box的位置和类别。
将图像分为S×S个网格，如果某个object的中心落在这个网格中，则这个网格就负责预测这个object。
每个网格要预测B个box，坐标+confidence，共5维。confdience计算如下，
每个网格预测5维，同时还要预测类别信息（假设有C类），则输出为S×S×（5×B + C）。文中S为7，B取2
，VOC数据集的C为20
网络

其他细节
改用 leaky ReLU激活函数：修正了数据的分布，保留了负值，是

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
目标检测总结：YOLO系列（1）

YOLO系列（1）YOLO v1之前两篇文章介绍了two-stage 的目标检测框架，本文开始介绍 one-stage。YOLO v1YOLO，解决了目标检测中最大的难题：速度，它为目标检测提供了新的思路。主要特点：1，快，2，将背景预测为前景的错误率小，3，泛化能力强。主要思想：将整张图作为网络的输入，直接在输出层回归box的位置和类别。将图像分为S×S个网格，如果某个objec...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。