扩张卷积(Dilated Convolution)也被称为空洞卷积或者膨胀卷积,是在标准的卷积核中注入空洞,以此来增加模型的感受野(reception field)。相比原来的正常卷积操作,扩张卷积多了一个参数:dilation rate,指的是卷积核的点的间隔数量,比如常规的卷积操作dilatation rate为1。
01 SPP (Spatial Pyramid Pooling)
文章:《Spatial Pyramid Pooling in Deep Convolutional Networks for VisualRecognition》
空间金字塔池化结构,主要是为了解决两个问题:
1.有效避免了对图像区域裁剪、缩放操作导致的图像失真等问题;
2.解决了卷积神经网络对图相关重复特征提取的问题,大大提高了产生候选框的速度,且节省了计算成本。
02 SPPF
03 SimSPPF(Simplified SPPF)
美团YOLov6提出的模块,和SPPF只差了一个激活函数,简单个ConvBNReLu速度要比ConvBNSiLU快18%。
参考文章:https://blog.csdn.net/LWD19981223/article/details/127673051
04 ASPP (Atrous Spatial Pyramid Pooling)
目的:在不改变shape即不降采样的前提下增大网络的感受野,增强网络获得多尺度上下文的能力。
05 RFB (Receptive Field Block)
RFB模块是在《ECCV2018:Receptive Field Block Net for Accurate and Fast Object Detection》一文中提出的,出发点是模拟人类视觉的感受野从而加强网络的特征提取能力,在结构上RFB借鉴了Inception的思想,主要是在Inception的基础上加入了空洞卷积,从而有效增大了感受野。
06 SPPCSPC
该模块是YoLov7中使用的SPP结构,表现优于SPPF,但参数量和计算量提升了很多
07 SPPFCSPC
参考文章:https://blog.csdn.net/weixin_43694096/article/details/126354660?ydreferer=aHR0cHM6Ly9jbi5iaW5nLmNvbS8%3D
注:本文仅用于学术分享,如有侵权,请联系后台作删文处理。
最后:
如果你想要进一步了解更多的相关知识,可以关注下面公众号联系~会不定期发布相关设计内容包括但不限于如下内容:信号处理、通信仿真、算法设计、matlab appdesigner,gui设计、simulink仿真......希望能帮到你!