（三）YOLO-V2改进细节

Vic.GoodLuck

已于 2022-02-09 15:01:13 修改

阅读量2.9k

点赞数 1

文章标签：深度学习机器学习 pytorch 目标检测

于 2022-02-09 14:43:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50533561/article/details/122838717

版权

YOLO目标检测专栏收录该内容

8 篇文章 4 订阅

订阅专栏

（1）Dropout与Batch Normalization

在V1版本中使用Dropout，在前向传播时，停止一部分神经元，使模型泛化性更强，防止过拟合

在V2版本中改进为BN（批量标准化），对数据进行归一化（统一格式、均衡化、去噪等），提高训练速度，提升训练效果

BN在目前已经成为网络必备模块

（2）更大的分辨率

V1版本中训练使用224*224的分辨率，而测试使用448*448

V2版本中额外加上10个epoch的448*448训练对模型进行微调

（3）网络结构（Darknet-19）

删掉了V1中的FC层（全连接层），改为用卷积层和池化层来提取特征，共进行了五次降采样，将特征大小压缩为原始图像的1/32倍

对于Darknet的不同版本，进行的卷积层数不同，其效率、精度不同，例如Darknet-74比Darknet-19卷积更深，得到的结果就更精确，但效率更低

（4）K-means聚类提取候选框（Anchors box机制）

V1中候选框是预先给出2个，V2中通过将比较常规的候选框与真实框进行聚类，选出5个最具有代表的候选框Anchors

（5）候选框与预测框的坐标偏移计算（Directed Location Prediction）

（图中黑色为anchor先验框，蓝色为预测框）

区别于V1中直接使用绝对偏移量，V2中使用相对于grid cell的偏移量进行预测，其中σ为sigmoid函数，将偏移量限制在[0,1]之间

（6）感受野的作用

感受野就是通过卷积池化等操作后，在特征图中的一块对应原图的一部分，相当于代表了这部分的特征，越大的感受野越能代表全局的特征

需要注意的是，对应得到相同的感受野，堆叠小的卷积核所需的参数更少一些，并且卷积过程越多，特征提取也会越细致，加入的非线性变换也随着增多，还不会增大权重参数个数，这也是VGG网络的基本出发点，用小的卷积核来完成体特征提取操作

（7）特征融合改进

得到最后一层特征图时，其对应的感受野很大，容易丢失小目标，所以需要与之前的特征进行融合

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
（三）YOLO-V2改进细节

（1）Dropout与Batch Normalization在V1版本中使用Dropout，在前向传播时，停止一部分神经元，使模型泛化性更强，防止过拟合在V2版本中改进为BN（批量标准化），对数据进行归一化（统一格式、均衡化、去噪等），提高训练速度，提升训练效果BN在目前已经成为网络必备模块（2）更大的分辨率V1版本中训练使用224*224的分辨率，而测试使用448*448V2版本中额外加上10个epoch的448*448训练对模型进行微调（3）网络结构（Darknet-19）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Vic.GoodLuck 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。