Yolov5s的主干网络笔记

接下来介绍Yolov5s的主干网络,主要有CSPDarknet,FPN金字塔加强特征,以及YOLOHEAD获取预测结果。
CSPDarknet的主要思想如下:
将输入的640,通道数为3的特征层经过Focus网络转化为320,通道数为12的特征层,再不断经过卷积标准化激活函数,以及残差网络结构会得到三个有效特征层,要强调的是最后一个预测分支中,会添加SPP。通过池化核为1 5 9 13的最大池化进行特征提取,再进行堆叠。提高感受野(目的是提前不同尺寸的空间特征信息,避免将图片crop成固定输入大小的弊端,即使某一部分被网络看到太多次,resize,即避免变形)
这三个有效特征层会输入到FPN中进行特征加强
将2020的特征层经过卷积上采样与4040特征层进行堆叠,并进行残差处理,再经过卷积上采样与80*80特征层堆叠并进行处理,得到第一个加强后的特征层,再依次经过下采样,堆叠得到第二三个特征层
输入YOLOHead得到预测结果。yolov5中,每一个特征层上的每一个特征点存在三个先验框。

上采样: 放大原图像,让图像有更高的分辨率
下采样: 缩小图像,起到过滤作用小,信息冗余的特征,保留关键信息

池化: 减少特征数据量

卷积标准化激活函数: 卷积对输入图像的操作都是线性的,所以通过激活函数进行非线性操作,更好的映射,去除数据冗余,增强卷积神经网络的表达能力。标准化对数据进行标准化处理。

为什么SPP只添加到最后一个预测分支
比较三个预测分支中都添加和只在一个预测分支中添加,会发现两者差别不大

残差网络为什么能解决梯度弥散问题
使用残差网络后,梯度不涉及任何权重层,且梯度不可能消失,使深度网络优化地形更平滑。

感受野: 卷积神经网络每一层输出的特征图(feature map)上的像素点映射回输入图像上的区域大小。通俗点的解释是,特征图上一点,相对于原图的大小,也是卷积神经网络特征所能看到输入图像的区域。

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值