YOLOv4结构图
绘制过程参考了@木盏该博主的思路
YOLOv3 结构图见下方链接
https://blog.csdn.net/leviopku/article/details/82660381
可能有错误之处,欢迎大家批评指正
图1 YOLOv4 的基本模块
图1的每个模块的具体解释如下:
(1) 空间金字塔池化(SPP,Spatial Pyramid Pooling)板块,目的主要是解决图像的纵横比(Ratio Aspect) 和输入图像的尺寸改变的情况,而不至于扭曲原始的图像,因此SPP的显著特点是使用多个窗口,用同一图像不同尺寸(Scale)作为输入,得到同样长度的池化特征,产生固定大小的输出。由于对输入图像的不同纵横比和不同尺寸,SPP同样可以处理,所以提高了图像的尺度不变(Scale-invariance)和降低了过拟合(Over-fitting),SPP对于特定的CNN网络设计和结构是独立的,只要把SPP放在最后一层卷积层后面,对网络的结构是没有影响, 只是替换了原来的池化层(Pooling layer)。
(2) CSPDarknetconv2D_BN_Mish_block板块,是YOLOv4的基本组件。即卷积层加上BN层加上Mish[16]激活函数层。2019年Misra提出的Mish作为新的深度学习激