一、核心思路
基于深度学习的分心驾驶行为识别理论基础。本章首先对驾驶员分心驾驶问题进行介绍,然后介绍CNN 的主要构成,接下来对经典分类网络VGG、ResNet、MobileNet进行详细介绍,最后对本文所用数据集及评价指标进行了介绍。基于深度学习的分心驾驶行为识别方案设计。本章对本文所提出的驾驶员分心驾驶行为识别算法的设计过程进行了阐述,接下来对算法的仿真实验验证进行了说明。包括,基于“Districted-Driver-Detection”和“ZJUT-Districted-Driver-Detection”数据集的三部分实验来对算法的精确度以及对图像的特征提取能力进行了验证。
基于树莓派的分心驾驶检测系统设计。本章首先针对如何实现驾驶员分心驾驶检测系统进行了详细介绍,包括联网状态“树莓派+远程服务器”和离线状态“树莓派+神经计算棒”两种结构。然后对模型的优化进行了阐述,最后通过实验对系统的性能进行了验证。
二、设计与仿真
CNN[32]是当前图像处理领域中使用最广泛的深度学习架构之一,具有表征学习和特征提取能力,并可进行目标分类。在对CNN 进行了大量的研究后,许多学者和研究人员将其分为三个部分:输入层是第一层,第二层由多层卷积层、激活函数层和池化层组成,而全连接层是第三层。CNN 主要由卷积层、池化层和全连接层构成。由图 为例,这便是一个典型的图像识别CNN 模型。
选用了ResNet-50 网络作为主干网络,该网络主要由残差块组成,通过跨越连接(shortcut)来解决训练深度网络时的梯度消失和梯度爆炸问题,从而实现了较深网络的训练。在驾驶员分心驾驶动作识别分类问题中,ResNet-50 主要用于提取图像特征并将其映射到低维空间,以实现不同驾驶行为的分类。具体改进点如下:针对数据集中驾驶员分心动作差异性较小问题,例如打电话和发短信这两个动作仅在手机所处位置有区别。在网络中加入了 RFB(Receptive Field Block)感受野模块,该模块可以增加网络的感受野,包含两个并行卷积层和一个空洞卷积层,用于提取更广泛的上下文信息。