yolov1

最新推荐文章于 2023-03-17 12:41:28 发布

孟同学

最新推荐文章于 2023-03-17 12:41:28 发布

阅读量336

点赞数

分类专栏： deep Learning

本文链接：https://blog.csdn.net/weixin_39610043/article/details/88129856

版权

本文深入解析YOLO v1的工作原理，包括每张图片最多检测49个对象，总共98个候选区域，以及与Faster RCNN中Anchor的差异。YOLO采用进化算法思想，通过训练逐步优化每个bounding box的预测能力。尽管其网格和bounding box设置导致精度不高，但因其实时性，仍受到工业界的关注。

摘要由CSDN通过智能技术生成

下面引用来自知乎<机器爱学习>YOLO v1深入理解
对于yolov1的理解非常清晰

① 一张图片最多可以检测出49个对象
每个30维向量中只有一组（20个）对象分类的概率，也就只能预测出一个对象。所以输出的 77=49个 30维向量，最多表示出49个对象。
② 总共有 492=98 个候选区（bounding box）
每个30维向量中有2组bounding box，所以总共是98个候选区。
③ YOLO的bounding box并不是Faster RCNN的Anchor
Faster RCNN等一些算法采用每个grid中手工设置n个Anchor（先验框，预先设置好位置的bounding box）的设计，每个Anchor有不同的大小和宽高比。YOLO的bounding box看起来很像一个grid中2个Anchor，但它们不是。YOLO并没有预先设置2个bounding box的大小和形状，也没有对每个bounding box分别输出一个对象的预测。它的意思仅仅是对一个对象预测出2个bounding box，选择预测得相对比较准的那个。
这里采用2个bounding box，有点不完全算监督算法，而是像进化算法。如果是监督算法，我们需要事先根据样本就能给出一个正确的bounding box作为回归的目标。但YOLO的2个bounding box事先并不知道会在什么位置，只有经过前向计算，网络会输出2个bounding box，这两个bounding box与样本中对象实际的bounding box计算IOU。这时才能确定，IOU值大的那个bounding box&#

最低0.47元/天解锁文章

孟同学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
yolov1

下面引用来自知乎&lt;机器爱学习&gt;YOLO v1深入理解对于yolov1的理解非常清晰① 一张图片最多可以检测出49个对象每个30维向量中只有一组（20个）对象分类的概率，也就只能预测出一个对象。所以输出的 77=49个 30维向量，最多表示出49个对象。② 总共有 492=98 个候选区（bounding box）每个30维向量中有2组bounding box，所以总共是98...
复制链接

扫一扫

专栏目录