单阶段（one-stage）:YOLO系列，从YOLO-V1到YOLO-V3发展过程及改进

最新推荐文章于 2024-11-24 19:57:56 发布

用大白话学习人工智能

最新推荐文章于 2024-11-24 19:57:56 发布

阅读量969

点赞数 22

文章标签： YOLO 机器学习人工智能

此文章为白雪个人所有

本文链接：https://blog.csdn.net/weixin_62263529/article/details/138579995

版权

深度学习经典的两种检测方式：

1.单阶段（one-stage）:YOLO系列

优点：速度非常快，适合做实时检测任务，将检测问题转换成回归问题，一个CNN就可以

缺点：效果不太好

2.双阶段（two-stage）:Faster-rcnn Mask-Rcnn系列

相比于单阶段，它加了预选框（Proposal）

优点：速度较慢

缺点：效果较好

下面就详细说明一下YOLO-V1到YOLO-V3的网络框架及改进

YOLO-V1:

网络架构：先验框有2个

优点：快速，简单

缺点：1.每个cell只预测一个类别，如果重叠就无法检测到

2.小物体检测效果一般，因为只有两种框，长宽比可选但是单一，所以优先检测大物体，

YOLO-V2：

YOLO-V2基于YOLO-V1的改进:

1. V2版本舍弃Dropout（在全连接层用到Dropout，防止过拟合），卷积后全部加入Batch Normalization（网络的每一层的输入都做了归一化，收敛相对更容易）经过Batch Normalization处理后的网络会提升2%的mAP

2. YOLO-V2-更大的分辨率，V1训练时用的是224*224，测试时使用448*448，可能导致模型不泛化，V2训练时额外又进行了10次448*448的微调，使用高分辨率分类器后，YOLO-v2的mAP提升了约4%

3. YOLO-V2-网络结构（加入DarkNet，舍弃全连接层）

加入DarkNet（没有全连接层，因为全连接层容易过拟合且训练慢，全是卷积层做的，DarkNet19就是19层卷积层），实际输入为416*416，没有FC层，5次降采样（5层池化），(13*13)，由下图可知，没有全连接层，并且1*1卷积节省了很多参数

4. YOLO-V2-聚类提取先验框：

通过引入anchor boxes，使得预测的box数量更多(13*13*n)，跟faster-rcnn系列不同的是先验框并不是直接按照长宽固定比给定，直白来讲就是将一堆数据集中的图像，利用K-means的方法，分成相近（高度和宽度相近）的k=5(根据coco数据集实验结果所得)类。且K-means聚类中的距离:d(boa, centroids) = 1-IOU(box , centroids)[注意：选择的不是欧式距离]

结果：mAP没有提高，recall提高了

5. YOLO-V2-Directed Location Prediction （定向定位预测，相对位置预测）

V2中并没有直接使用偏移量，而是选择相对grid cell的偏移量

6. YOLO-V2-Fine-Grained Features

最后一层时感受野太大了，小目标可能丢失了，需融合之前的特征,将前面的感受野与最后一层做特征融合，这样特征提取更多

##########简单补充一下感受野######

感受野（越大的感受野越能考虑全局）

概述来说就是特征图上的点能看到原始图像多大区域

7.YOLO-V2-Multi-Scale （多尺度）

因为检测过程中图片大小有可能变化，所以在卷积层可以调整图片大小

综上所述，YOLO-V2比YOLO-V1 更快，更强，mAP明显提升

YOLO-V3：

最大的改进就是网络结构，使其更适合小目标检测，为了能检测到不同大小的物体，设计了3个scale,每种3个规格，一共9种,这些scale大小不一，大的预测大的，中等大小预测中等大小，小的预测小的

13×13的感受野最大，可预测大物体

3种scale互相再做特征融合（采用上采样的方式），而不是不同特征图分别利用

softmax改进，预测多标签任务（不仅是狗，还是哺乳动物），没有池化和全连接层，全部卷积。

下采样通过stride为2实现

用大白话学习人工智能

博客等级

码龄4年

10
原创

103
点赞

78
收藏

58
粉丝

关注

私信

热门文章

最新评论

单阶段（one-stage）:YOLO系列，从YOLO-V1到YOLO-V3发展过程及改进
CSDN-Ada助手: 恭喜您在博客中深入探讨了YOLO系列的发展过程及改进，对单阶段目标检测算法有了更深入的了解。希望您能继续保持创作的热情，不断探索更多前沿技术和实践经验，或许可以考虑结合实际案例进行分析，让读者更易于理解和应用。期待您的下一篇精彩文章！祝您越来越好！
如何快速找到相关参考文献（来不及看文献）
CSDN-Ada助手: 恭喜作者发布了第5篇博客！标题看起来非常吸引人，我相信这篇文章一定会受到很多人的关注和喜爱。对于忙碌的读者来说，如何快速找到相关参考文献确实是一个很实用的技巧。接下来，我建议作者可以考虑分享一些阅读文献的技巧，比如如何快速阅读和理解文献内容，这样读者可以更高效地获取知识。希望作者继续保持创作热情，为大家带来更多有用的内容！
加载各类样本数据集
CSDN-Ada助手: 很棒的博客！你对加载各类样本数据集的方法进行了清晰的介绍，让读者能够快速掌握相关技能。希望你能继续分享更多关于数据处理的内容，比如数据清洗、特征提取等方面的知识，这些都是在数据分析和机器学习中非常重要的环节。期待你的下一篇博文！加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
机器学习过程中经常遇到的numpy操作(上机可实现)
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。