目录
ABSTRACT:
驾驶员分心行为容易引发交通事故。本文提出了一种基于通道扩展和注意力机制的改进YOLOv7,用于驾驶员分心行为检测,名为CEAM-YOLOv7。使用GAM注意力机制提高准确性,在CEAM-YOLOv7架构中,简化掉了很多的卷积结构,用来提高检测速度。结合Inversion和clahe图像增强算法,提出了一种用于数据增强的通道扩展(CE)算法,以进一步优化红外图像的检测效果。在湖南科技大学和湖南大学的驾驶员分心IR数据集上,验证结果表明,该文模型与原始YOLOv7模型相比,CEAM-YOLOv7实现了20.26%的高mAP,FPS达到156,这表明CEAM-YOLOv7在精度和速度方面都优于最先进的方法。
Introduction:
该文提了一些前人的驾驶员疲劳检测算法,指出之前的算法和模型大多使用单尺度深度特征,难以提高复杂驾驶场景下的检测性能。此外,上述算法大多具有较大的模型,难以在车载终端上部署,且FPS太低,无法应用于实际驾驶场景。因此,本文将模型轻量级的思想应用到YOLOv7结构中,大大减少了计算负载,满足了应用需求。
CEAM-yolov7
(1)在数据方面,本文将单通道的红外图像通过Inversion和clahe扩展为三通道图像,丰富了图像信息
(2)引入了GAM注意力机制
(3)轻量化网络,去除了很多卷积层
(4)将激活函数更换为Mish函数
(5)应用了一些数据增强,扩充数据集
图像预处理算法
将单通道的图像通过clahe,inversion拼接为三通道图像
网络架构图
CEAM优化掉了很多yolov7的卷积层,锐减了80%的参数量
实验结果
消融实验
CONCLUSION
在这项研究中,我们提出了CEAM-YOLOv7,它的性能优于现有的单阶段检测器。插入网络的GAM模块提高了驾驶员行为的特征提取能力。轻量化使IR图像特征更容易提取,模型更容易部署。基于HNUST和HNU的驾驶员分心红外图像数据集,训练后的模型能够更好地适应驾驶场景的光线变化。实验结果表明,该方法具有156FPS的快速检测速度,mAP比原始YOLO7网络提高了20.26%。训练后的模型体积小,可以很容易地部署在车载终端上进行实时驾驶员行为识别