YOLOv5-小知识记录(三)

最新推荐文章于 2024-07-12 23:04:56 发布

Skywalker_air

最新推荐文章于 2024-07-12 23:04:56 发布

阅读量1.3k

点赞数 20

分类专栏： Yolo系列算法文章标签： YOLO

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Skywalker_air/article/details/137133551

版权

Yolo系列算法专栏收录该内容

14 篇文章 3 订阅

订阅专栏

0. 写在前面

本篇介绍SPP模块、FPN模块模块，主要也是对YOLOv5的内容的补充：

Yolo系列算法-理论部分-YOLOv4-CSDN博客

Yolo系列算法-理论部分-YOLOv5-CSDN博客

上一篇：

YOLOv5-小知识记录(二)-CSDN博客

1. SPP模块

Spatial Pyramid Pooling，设计该模块的目的是，确保输入全连接层之间的特征向量feature vector是固定尺寸。feature vector 是feature maps的展开，常规的做法是对输入的数据进行剪裁和变形操作，这两种操作可能引发裁剪区域没包含物体的全部或者目标无用，是真严重等问题；而SPP则是将不同feature maps展开为固定尺寸的feature vector。

工作原理：对每个特征图，使用三种不同尺寸的池化核进行最大池化，分别得到预设的特征尺寸，最后将所有特征图展开为特征向量并融合。

以经过了5次卷积模块运算后的Tensor[1,256,10,10]，运用SPP原理倒推最大池化层信息。

步骤：

明确全连接层的输入参数尺寸：107521 = 21*256 = 16*256+4*256+1*256；
明确三种池化后的特征图尺寸，4*4,2*2,1*1；
求出三种的kernel、stride和padding：
1. 4*4对应的kernel = 10/4 = 3；stride = 10/3 = 3；padding = [(3*4-10+1)/2] = 1;
2. 2*2对应的kernel = 10/2 = 5 ； stride = 10/2 = 5;padding = [(5*2 -10 +1)/2] = 0；
3. 1*1对应的kernel = 10/1 = 10; stride = 10/1 = 10;padding = [(10*1 - 10 +1)/2] =0。

优点：可以忽略输入尺寸并产生固定长度的输出；利用不同池化核尺寸提取特征的方式可以获得丰富的特征信息，有利于提高网络的识别精度。

2. FPN模块

Feature pyramid network，在目标检测中加入特征金字塔，提高目标检测的准确率，尤其是在小物体的检测上。

特征金字塔的高（深）层特征包含丰富的语义信息（利于分类），但分辨率低，很难准确地保存物体的位置信息；低（浅）层特征虽然语义信息较少，但分辨率高，包含准确地物体位置信息（有利于检测和分割）。

FPN将低层特征和高层特征融合起来，得到一个识别和定位都准确地目标检测结构。

主要包括：Bottom-up、Top-down和Lateral connection。

（1）Bottom-up：就是将图片输入到backbone中提取特征的过程；

（2）Top-down：就是将高层得到的feature map进行上采样然后往下传递，将深层包含语义信息传到低层特征上，使低层特征也能包含丰富语义信息；

（3）Lateral connection:是一个特征融合过程，P1是C1经过1*1卷积后的特征与P2上采样后的特征进行融合（add方式，直接相加，不增加维度）。

关注

20
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Skywalker_air CSDN认证博客专家 CSDN认证企业博客

码龄8年

53: 原创

41万+: 周排名

10万+: 总排名

5万+: 访问

: 等级

1103: 积分

413: 粉丝

505: 获赞

8: 评论

363: 收藏

私信

关注

热门文章

分类专栏

最新评论

YOLOv5-小知识记录(四)
hoooo1: 大神你好，SS928移植yolov5成功了吗？
Qt-线程1-Run
普通网友: 写的真好！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
Opencv-光流算法-实战
CSDN-Ada助手: 不知道 OpenCV 技能树是否可以帮到你：https://edu.csdn.net/skill/opencv?utm_source=AI_act_opencv
基于深度学习的目标检测算法概述
CSDN-Ada助手: 恭喜您发布了第20篇博客！您对基于深度学习的目标检测算法进行了概述，内容丰富、深入，让人受益匪浅。希望您能继续保持创作的热情和动力，不断探索更多深度学习相关的内容，或许可以考虑深入研究某一具体算法的原理及应用，或者分享一些实际案例和经验交流。期待您的下一篇精彩文章！
Windows11+OpenCV4.5+Qt5.9.1安装教程
CSDN-Ada助手: 恭喜你完成了这篇有用的教程！Windows11+OpenCV4.5+Qt5.9.1安装教程对很多人来说都是一个挑战，你的分享无疑会帮助到很多人。接下来，或许可以考虑分享一些实际应用案例，让读者更直观地了解这些工具的用途和效果。希望你能继续保持创作的热情，期待看到更多有趣的内容！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。