YOLO系列——yolov2

yayakoko

已于 2023-09-18 10:42:06 修改

阅读量164

点赞数

文章标签： YOLO 人工智能机器学习

于 2023-09-14 17:44:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yayakoko/article/details/132875044

版权

检测模型 = 特征提取器+检测头

一、yolov2

1、基本概念

yolov1的检测速度快，但是预测框不准确，很多目标找不到

预测的框不准确
目标找不到

问题 1：预测的框不准确

yolov1直接预测的是目标框的坐标（x，y，w，h），yolov2改进预测的是目标框的偏移量。直接预测位置会导致神经网络在一开始训练时不稳定，使用偏移量会使得训练过程过程更加稳定，性能指标提升。

偏移量：

模型预测的值为：tx、ty、tw、th

模型最终的检测结果为：bx、by、bw、bh

$\sigma =\frac{1}{1+e^{-x}}$

cx、cy为grid左上角坐标，pw、ph为Anchor的宽高。

问题 2：很多目标找不到

将yolov1的 7 x 7 改为 13 x 13 区域，而且每个区域有5个Anchor（锚框），而且每个锚框对应一个类别。

1、为什么用Anchor

2、每个区域的5个Anchor是如何得到的呢

对训练集中的GT bounding box进行聚类，根据实验发现聚5类较合理。

anchor是从数据集中统计获得的，Faster-RCNN中的Anchor的宽高和大小是手动挑选的。

2、yolov2的网络结构

2. 1 网络模型（Darknet-19）

采用19个卷积层，5个池化层

2. 2 相对于yolov1的改进

（1）加入BN

解决梯度消失和爆炸，起到一定的正则化效果

（2）使用高分别率图像，微调分类模型

yolov1：训练使用224x224，测试：448x448

yolov2：保持v1不变，但是在原训练的基础上加上（10个epoch）的448x448高分别率样本进行微调，测试用448x448。

（3）聚类使用先验框

yolov2对训练集中所有标注的边界框进行聚类（5类），将每一类的中心中心实际值（w，h）作为先验Anchor

（4）相对偏移计算

（5）细粒度特性——提高对小目标的检测能力

对不同层的特征进行融合，高分别率的浅层进行拆分叠加到低分辨率的深层特征

（6）多尺度检测

每经过一定次数的迭代，可以进行输入图像尺度变化。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
YOLO系列——yolov2

检测模型 = 特征提取器+检测头。
复制链接

扫一扫

yayakoko CSDN认证博客专家 CSDN认证企业博客

码龄6年

36: 原创

12万+: 周排名

5万+: 总排名

5571: 访问

: 等级

492: 积分

57: 粉丝

29: 获赞

2: 评论

31: 收藏

私信

关注

热门文章

分类专栏

PyTorch - Deep Learning
python 4篇

最新评论

pytorch ：LSTM二分类网络
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
股票交易最大利润
虎哥闯天涯: 博主多加油，继续编写，把股票交易得思路以及使用算法写出来，另外把代码注释加一下，以及测试用例

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。