参考链接:https://blog.csdn.net/weixin_47196664/article/details/107479182
https://zhuanlan.zhihu.com/p/76802514
https://blog.csdn.net/c20081052/article/details/105995753
YOLOV4:
1)相较于YOLO V3的DarkNet53,YOLO V4用了CSPDarkNet53
2)相较于YOLO V3的FPN,YOLO V4用了SPP+PAN
3)CutMix数据增强和马赛克(Mosaic)数据增强
4)DropBlock正则化
等等
自己的记录:
1)backbone使用了5个CSP模块(1,2,8,8,4),得到19*19大小的特征图(608->304->152->76->38->19)。
而且作者只在Backbone中采用了Mish激活函数,网络后面仍然采用Leaky_relu激活函数。
CSPNet的作者认为推理计算过高的问题是由于网络优化中的梯度信息重复导致的。所以这里采用csp的结构,主要优点在于:增强CNN的学习能力,使得在轻量化的同时保持准确性;降低计算瓶颈;降低内存成本
YOLOv3:
主要体现在网络结构上的改变。
backbone改成了Darknet-53
YOLOv2:
1)引入了fast-rcnn中的anchor box的思想
2)输出层改为卷积层代替全连接层
3)去掉了dropout层,改为利用更多的BN等方法
4)使用k-means的方法来对训练集中的先验框进行聚类,生成合适的先验框
YOLOv1:
1)输入图像是固定尺寸
2)输出层为全连接层