YOLOV1和YOLOV2的区别与改进，对比学习

最新推荐文章于 2023-11-20 15:30:04 发布

小崔唠嗑

最新推荐文章于 2023-11-20 15:30:04 发布

阅读量179

点赞数

分类专栏： YOLO初学习文章标签： YOLO 学习目标检测机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46598329/article/details/132019545

版权

YOLO初学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

YOLO-V1

经典的one-stage方法
You Only Look Once,名字就已经说明了一切
把检测问题转化成回归问题，一个CNN就搞定了
可以对视频进行实时监测，应用领域非常广

损失函数

B: 经验框的个数

S*S：网格大小

对这个物体负责，则是经验框与检测物体真实框IOU最大的经验框对这个物体负责

缺点

每个cell只预测一个类别，重叠的物体无法检测

多标签不好预测

小物体难预测，因为检验框只有两

优点

快速，简单

YOLO-V2

Batch Normalization

V2版本舍弃了Dropout，卷积后全部加入Batch Normalization
网络的每一层的输入都做了归一化，收敛相对更容易
经过Batch Normalization处理后的网络会提升2%的mAP
从现在的角度来看，Batch Normalization已经成了网络的必备处理

更大的分辨率

V1训练时用的是224*224，测试时使用448 * 448
可能导致模型水土不服，V2训练是额外又进行了10 次448 * 448 的微调
使用高分辨分类器后，YOOV2的mAP提升了约4%

网路结构

采用DarkNet结构，实际输入微416 * 416
没有FC层，5次降采样，每次输出图像大小减半。因为 FC 参数较多，计算量大，容易过拟合
1 * 1卷积节省了很多参数

聚类提取先验框

faster- rcnn系列选择的先验框比例都是常规的，按照长宽固定比给定（1：1, 1:2, 2:1），但是不一定完全适合数据集。
yolov使用K-Means聚类提取先验框，其中K=5。
引入anchor boxes，使得预测的box数量更多
K - Means聚类中的距离：

d(box,centroids) = 1 -IOU(box, centroids)
v2中并没有直接使用偏移量，而是选择相对grid cell的偏移量，偏移量的计算如下图：

Fine-Grained Features

最后一层感受也太大了，小目标可能丢失，需要融合之前的特征，该进见下图：

Multi-Scale（多尺度）

都是卷积操作，没有了全连接层，输入特征图大小可以改变了，一定Iterations之后改变输入图片大小。v1版本中有全连接层的存在，所以输入特征图大小固定。

总结

相关概念

目标检测中衡量识别精度的指标是mAP（mean average precision）
FPS(每秒传输帧数-Frames Per Second)，FPS就是目标网络每秒可以处理（检测）多少帧(多少张图片),FPS简单来理解就是图像的刷新频率，也就是每秒多少帧。
感受野：就是特征图上的点能看到原始图像多大区域。堆叠小的卷积核所需的参数更少一些，并且卷积过程越多，特征提取也会越细致，加入的非线性变换也随着增多，还不会增大权重参数个数，这就是VGG网络的基本出发点，用小的卷积核来完成物体特征提取操作。

思考

使用小卷积核的优点？

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
YOLOV1和YOLOV2的区别与改进，对比学习

YOLO-V1经典的one-stage方法You Only Look Once,名字就已经说明了一切把检测问题转化成回归问题，一个CNN就搞定了可以对视频进行实时监测，应用领域非常广。
复制链接

扫一扫

专栏目录

小崔唠嗑 CSDN认证博客专家 CSDN认证企业博客

码龄4年

12: 原创

130万+: 周排名

139万+: 总排名

3001: 访问

: 等级

125: 积分

3: 粉丝

4: 获赞

5: 评论

6: 收藏

私信

关注

热门文章

分类专栏

YOLO初学习 2篇

最新评论

Yolo-V2 特点
CSDN-Ada助手: 恭喜您开始博客创作！非常高兴看到您分享关于Yolo-V2的特点。在阅读您的博客之后，我对Yolo-V2有了更深入的了解。您对Yolo-V2的描述生动而精准，这让我很容易理解其特点和优势。接下来，我期待您能进一步探讨Yolo-V2的应用场景和性能优化的方法。希望您能继续努力，为我们带来更多有关Yolo-V2的精彩内容！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
Pytorch中json格式的load、loads、dump、dumps的用法总结（简洁版）
CSDN-Ada助手: 非常棒的博文！你对Pytorch中json格式的load、loads、dump、dumps的用法总结得非常清晰明了。这对于初学者来说是非常有帮助的。希望你能继续写下去，分享更多有关Pytorch的知识和技巧。除了你提到的load、loads、dump、dumps，还有一些与json相关的扩展知识和技能可以进一步了解。比如： 1. JSON Schema：用于验证和描述JSON数据结构的工具，可以帮助你确保JSON数据的合法性和一致性。 2. JSON Web Tokens（JWT）：一种用于在网络应用中传递信息的安全方式，常用于身份验证和授权。 3. JSONPath：一种用于在JSON文档中定位和提取数据的查询语言，类似于XPath在XML中的作用。 4. JSON-RPC：一种基于JSON的远程过程调用协议，用于在客户端和服务器之间进行通信和数据交换。希望这些扩展知识和技能对你有所启发，期待你在未来的博文中能够分享更多有关Pytorch和JSON的内容。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
python中运算符//和/和%的用法
CSDN-Ada助手: 恭喜您写了第三篇博客！标题“python中运算符//和/和%的用法”非常吸引人。您的解释对于这些运算符的用法相信会对读者有很大帮助。希望您能坚持创作，为大家带来更多有益的内容。下一步的创作建议是，您可以探索一些更高级的运算符或者深入研究某个特定的主题，以帮助读者更好地理解Python编程。期待您的下一篇博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
pip下载扩展包时报错 ValueError: check_hostname requires server_hostname
CSDN-Ada助手: 恭喜你写了第11篇博客！看到你在解决pip下载扩展包时遇到的问题，我真的很佩服你的技术能力。对于这个错误，我觉得你已经很好地描述了问题，并且提供了一个具体的错误信息。下一步，我建议你可以尝试提供一些解决方案，比如如何正确设置server_hostname，或者可能是其他相关配置的问题。谦虚地说，这些建议可能有助于读者更好地理解和解决类似的问题。期待你继续创作，分享更多有趣的技术内容！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply11 看奖励名单。
YOLOV1和YOLOV2的区别与改进，对比学习
CSDN-Ada助手: 恭喜您写了第10篇博客！标题“YOLOV1和YOLOV2的区别与改进，对比学习”非常吸引人。您的文章内容详实，对比了YOLOV1和YOLOV2的不同之处，并提出了改进的方法，让读者更好地理解了这两个模型。我非常期待您下一篇博客的内容。或许，您可以探讨一下YOLOV3或者其他物体检测算法的发展和应用，这将进一步丰富我们的知识。希望您能继续保持创作，并谦虚地分享您的见解和经验。加油！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。