天池竞赛-布匹缺陷检测baseline提升过程-给yolov5模型添加注意力机制

最新推荐文章于 2024-08-14 00:28:52 发布

*pprp*

最新推荐文章于 2024-08-14 00:28:52 发布

阅读量1.4w

点赞数 50

分类专栏：比赛从零开始学习YOLOv3 cv中的attention机制文章标签：人工智能 python 深度学习

原创文章不要私自转载，自私转载必究责任，如需转载请联系wx:topeijie商谈

本文链接：https://blog.csdn.net/DD_PP_JJ/article/details/114098169

版权

这次比赛选择了官方提供的baseline yolov5进行训练，一开始使用的是yolov5s.yml配置文件进行训练的，并且数据也只是train2一小部分，由于笔者这里服务器只有一个1080Ti的可以使用，所以实验跑起来速度还是有点慢的，做的尝试也不是很多，下面是流水账。

第一次成功提交

第一次提交就是使用了train2部分数据集，设置了50个epoch，使用迁移学习，分辨率设置为500x500,花费大概2个小时训练完成。这个成绩的acc还不错，是因为conf thresh设置的值比较低，所以acc可以达到比较高的结果。但是mAP就很差，一方面是数据量不足导致的，另一方面是模型容量比较小。

第二个比较不错的结果

之后开始将train1部分的数据加进来，增大epoch个数到100，模型使用更大的yolov5x.yml,分辨率也提高到1000x1000，虽然有所提高，但是提高并不多。值得一提的是数据直接通过wget在linux中下载，并解压会出现错误，使用了论坛提供的tar方法也没有很好的解决。window上测试解压效果就很好，图片都没有损坏，不知道具体原因。但是如果从我本地window上传到服务器上，速度慢的简直不可忍受，所以就放弃了上传。采用了那些没有损坏的图片进行训练，尽管失去了一部分数据集，数据量还是很大的，训练yolov5x一般需要12-24个小时，时间比较久。

后边怀疑可能是yolov5自带的mosic数据增强方法有问题，因为它会将四张图片组成一个进行训练，比较长的目标会有所损耗，所以关闭了这个数据增强方法。经过很长时间的训练，发现mosic还是有效果的，去掉了应该会掉点。

去掉了mosic数据增强方法

后边时间就到现在了，期间研究了一下yolov5的模型组织方式。因为之前笔者曾经用过yolov3, 那时候的数据组织方式是cfg文件，比较容易理解，但是也比较难改。在yolov5中使用了yaml文件进行组织，重复的模块可以通过number设置即可，降低了构建的难度。yolov5中也提供了多种多样的新模块，比如：CSP模块、SPP模块、GhostBottleneck模块、MixConv2d模块、CrossConv模块等等，这都是比较新的文章中提到的，方便进行实验。

因为笔者之前研究过attention机制，也成功在yolov3中添加过attention模块，带来了一定的收益。所以之后的改进思路是添加SELayer，这个注意力模块的鼻祖。一般来说注意力模块作用是：增加模型的远距离依赖、增加模型复杂度、提高准确率（不绝对）等作用。这次也想在yolov5中研究添加SE的方法，这里做一个笔记总结。实验还在跑，后边会补充结果。

先讲一下配置文件：以yolov5x.yaml为例：

# parameters
nc: 15  # number of classes
depth_multiple: 1.33  # model depth multiple
width_multiple: 1.25  # layer channel multiple

# anchors
anchors:
  - [10,13, 16,30, 33,23]  # P3/8
  - [30,61, 62,45, 59,119]  # P4/16
  - [116,90, 156,198, 373,326]  # P5/32

# YOLOv5 backbone
backbone:
  # [from, number, module, args]
  [[-1, 1, Focus, [64, 3]],  # 0-P1/2                 #1
   [-1, 1, Conv, [128, 3, 2]],  # 1-P2/4              #2
   [-1, 3, C3, [128]],                                #3
   [-1, 1, Conv, [256, 3, 2]],  # 3-P3/8              #4
   [-1, 9, C3, [256]],                                #5
   [-1, 1, Conv, [512, 3, 2]],  # 5-P4/16             #6
   [-1, 9, C3, [512]],                                #7
   [-1, 1, Conv, [1024, 3, 2]],  # 7-P5/32            #8
   [-1, 1, SPP, [1024, [5, 9, 13]]],                  #9
   [-1, 3, C3, [1024, False]],  # 9                   #10
  ]

# YOLOv5 head
head:
  [[-1, 1, Conv, [512