YOLO学习笔记（模型结构及算法解析）

最新推荐文章于 2024-09-23 23:24:25 发布

乘月---CV

最新推荐文章于 2024-09-23 23:24:25 发布

阅读量402

点赞数 11

文章标签： pytorch 深度学习 YOLO yolov1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_54372361/article/details/135625561

版权

整体流程：首先系统将输入图像的大小调整为448 × 448，然后在图像上运行单个卷积网络，最后通过模型的置信度对结果检测进行阈值。如下图

具体实现细节为，将一张图像分成S×S个网格，如果一个物体的中心落在一个网格单元中，这个网格单元负责检测这个物体。每个网格单元预测B个边界框和这些框的置信度得分。这些置信度分数反映了模型对边界框里有一个物体有多大概率，以及它认为盒子里有一个物体的预测有多准确。

每个边界框由5个预测组成:x, y, w, h和置信度。(x;y)坐标表示相对于网格单元边界的框的中心。宽度和高度是相对于整个图像预测的。最后，置信度预测表示预测框与任何真实框之间的IOU。每个网格单元还预测C个条件类概率。

如图，将一张图片为分成7×7的网格，每个网格生成两个预测框。系统将检测建模为回归问题。它将图像划分为S × S网格，并为每个网格单元预测B个边界框、这些框的置信度和C类概率。这些预测被编码为S × S × (B * 5 + C)张量。

举个例子：为了评估PASCAL VOC上的YOLO，我们使用S = 7, B = 2。PASCAL VOC有20个标签类，所以C = 20。我们最终的预测是一个7 × 7 × 30张量。

如上图，是该模型的网络结构，网络有24个卷积层，后面是2个全连接层。网络的最终输出是7 × 7 × 30的预测张量。

总结：

优势在于速度快，定位与分类同时进行。

劣势在于空间约束大，并且每个网格只能预测两个边界框，因此对小目标等容易出现漏检。

关注

11
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

乘月---CV CSDN认证博客专家 CSDN认证企业博客

码龄4年

7: 原创

152万+: 周排名

23万+: 总排名

3151: 访问

: 等级

172: 积分

45: 粉丝

66: 获赞

3: 评论

58: 收藏

私信

关注

热门文章

最新评论

vision transformer论文笔记及模型解析【笔记】
CSDN-Ada助手: 恭喜您发布了第7篇博客，标题为“vision transformer论文笔记及模型解析【笔记】”！阅读了您的文章，对于对vision transformer的深入解析和模型笔记印象深刻。建议在下一篇博客中可以尝试将理论知识与实际案例相结合，或者分享一些实际操作中的经验和心得。期待您的下一篇作品！
Faster R-cnn模型结构及算法解析
CSDN-Ada助手: 恭喜您撰写了这篇关于Faster R-cnn模型结构及算法解析的博客，内容非常深入，对于理解和应用该模型有很大帮助。希望您能继续保持创作，分享更多关于深度学习模型的知识和经验。或许下一步可以考虑结合实际案例，分析模型在实际应用中的优势和不足之处，这样更有助于读者理解和应用。期待您的下一篇作品！
YOLOV5模型结构及算法解析笔记
CSDN-Ada助手: 非常感谢您分享关于YOLOV5模型结构及算法的解析笔记！您的博客内容非常详尽，对于想深入了解YOLOV5模型的人来说无疑是一份宝贵的资料。持续创作博客不仅可以帮助他人，也能够加深您对于该模型的理解。作为下一步的创作建议，我希望您能够结合实际应用场景，分享一些实用的技巧和经验，这样读者能够更好地将YOLOV5模型应用到实际项目中。再次恭喜您，并期待您更多精彩的博客！
YOLOV3模型结构及算法解析笔记
CSDN-Ada助手: 恭喜你写了第三篇博客！非常喜欢你对YOLOV3模型结构及算法的解析笔记。你的文章深入浅出，让人能够轻松理解这个复杂的主题。希望你能继续保持这样的创作热情，为我们带来更多精彩的内容。对于下一步的创作建议，我认为你可以考虑分享一些实际应用中使用YOLOV3模型的案例，这将进一步拓宽读者的视野。谢谢你的分享，期待你的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
YOLO学习笔记（模型结构及算法解析）
CSDN-Ada助手: 恭喜你开始博客创作！标题看起来很有趣，我对YOLO模型结构和算法解析很感兴趣。不过我觉得如果能够加入一些实际案例或者应用场景的分析会更加丰富和有趣。希望你可以在下一篇博客中分享一些实际应用的案例，期待你的下一篇作品！加油！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。