YOLO、YOLOv2、YOLO9000和YOLOv3的发展过程

最新推荐文章于 2024-08-20 14:58:38 发布

咩咩咩咩没

最新推荐文章于 2024-08-20 14:58:38 发布

阅读量353

点赞数

分类专栏：面试学习路线阿里巴巴文章标签： java java进阶后端

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_67401153/article/details/124777632

版权

YOLO是一种基于端到端的实时目标检测方法，其后续版本YOLOv2通过引入BN、聚类先验框、多尺度训练等改进提升了检测性能。YOLOv2的改进包括在anchor上提取特征，使用不同尺寸特征图结合检测，采用darknet-19结构。YOLO9000通过联合训练实现对9000种物体的检测。YOLOv3则进一步使用Darknet-53和FPN结构，优化损失函数以支持多标签检测。

摘要由CSDN通过智能技术生成

YOLO

yolo的基本思想是使用一个端到端的CNN直接预测目标的类别和位置，相对two-stage，yolo实时性高，但检测精度低。YOLO每个边界框只预测两个框，主体结构GoogLeNet，由24个卷积层和2个FC层组成。

YOLOv2

YOLOv2针对yolov1两个缺点：

低召回率
低定位准确率

改进：

YOLOv2在卷积层后添加了BN，加快收敛速度，防止过拟合
v2的卷积特征提取器在进行检测任务之前，先在高精度图片上调优10个批次，这样能使检测模型提前适应高分辨率图像
v2采用k-means算法进行聚类获取先验框大小，聚类没有采用欧式距离，而是采用1 - IOU ，这样使其更适合于检测任务。
v2直接在预先设定的anchor上提取特征，YOLO使用卷积神经网络作为特征提取器，v1是anchor-free，v2则借鉴Faster R-CNN思路采用anchor-based
v2将图像 448 x 448变为416 * 416，经过32倍下采样后，图像变为13*13，长宽都是奇数，可以有效地识别出中心
v2 将不同大小的特征图结合起来做物体检测，具体来说将最后一个池化层的输入 26 * 25 _512 经过Passthrough Layer变成13_13_2048，再与池化后的13_13*1024结合起来一起进行物体检测
v2使用不同尺寸图片同时训练网络，每10个epoch就改变输入图像的大小

最低0.47元/天解锁文章

咩咩咩咩没

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。