使用面部标记提取和深度神经网络进行“昏昏欲睡”的检测

最新推荐文章于 2021-07-27 23:53:07 发布

架构师小秘圈

最新推荐文章于 2021-07-27 23:53:07 发布

阅读量283

点赞数

640?wx_fmt=jpeg

导言

本文的目的是解释如何使用面部标志作为神经网络的输入来检测昏昏欲睡的人，在这种情况下，3D卷积神经网络发出警报以唤醒用户并防止某种形式的事故。

我们的想法是从网络摄像头中提取一组帧，然后从中提取面部标志，特别是双眼的位置，然后将这些坐标传递给神经模型，以获得最终分类，告诉我们用户是否清醒或者睡着了。

方法

最近的工作表明，使用3D卷积神经网络或Conv3D可以实现活动识别，因为不是分析单个帧而是分析它们的一组，这组帧是包含活动的短视频。

话虽如此，并将昏昏欲睡视为可以包含在视频中的活动，但使用Conv3D来尝试预测困倦是有意义的。

第一步是从相机中提取帧，在我们的例子中是网络摄像头。一旦我们有了框架，我们就会使用一个名为dlib的python库，其中包含一个面部标志检测器; 结果是x，y坐标的集合，指示面部标志的位置。

640?wx_fmt=png

即使我们得到一个点的集合，我们只对眼睛的位置感兴趣，所以我们将只保留属于眼睛的十二个点。

640?wx_fmt=png

到目前为止，我们拥有单帧的面部标志。然而，我们希望给我们的系统提供序列感，并且为此，我们不考虑单帧来进行最终预测，我们最好采用它们中的一组。

我们认为，一次分析一秒钟的视频就足以做出好的睡意预测。因此，我们保持十个面部地标检测，相当于一秒视频; 然后，我们将它们连接成一个单一的模式，即一个具有形状（10,12,12）的数组; 10个帧，x坐标为12个点，y坐标为12个点。此数组是我们的Conv3D模型的输入，以获得最终分类。

640?wx_fmt=png

我们模型的第一个隐藏层是3D卷积层，接着是最大池化层和展平层，这导致了800个神经元的向量。下一层是青少年单元的密集层，具有relu激活功能。模型y的最后一层由两个神经元组成，其中激活函数是softmax函数，由两个神经元组成，每个类一个。

构建

网络摄像头总是流式传输视频，但我们每0.1秒分析一个帧，直到我们达到10个样本，相当于1秒，以提取面部标志并仅保留对应于双眼的点。我们将这些点分组为7个单元的重叠，这意味着我们将点从第一帧分组到十个，下一组从第四帧到第十三帧形成。

一旦我们有一组眼睛的点（x，y坐标），我们将它们传递给我们的神经模型以获得分类，其结果可以是[1,0]代表“清醒”，或者[0,1]代表“昏昏欲睡”。换句话说，我们正在分析小块网络摄像头的流媒体，以便每秒预测困倦。

640?wx_fmt=png

执行

在这里，您可以找到如何获得本文中使用的每个元素。

该系统是在python 3.5上实现的
使用OpenCV for python实现从网络摄像头中提取帧
使用库dlib提取面部标志
该模型使用keras构建
在烧瓶的帮助下部署了前端。

from keras.utils import plot_modelfrom keras.models import Modelfrom keras.layers import Inputfrom keras.layers import Densefrom keras.layers import Flattenfrom keras.layers.convolutional import Conv3Dfrom keras.layers.pooling import MaxPooling3Dfrom keras.models import Sequentialvisible = Input(shape=(10,12,12,1))conv1 = Conv3D(8, kernel_size=2, activation='relu')(visible)pool1 = MaxPooling3D(pool_size=(2, 2, 2))(conv1)flat1 = Flatten()(pool1)hidden1 = Dense(10, activation='relu')(flat1)output = Dense(2, activation='softmax')(hidden1)model = Model(inputs=visible, outputs=output)import plot_model
from keras.models import Model
from keras.layers import Input
from keras.layers import Dense
from keras.layers import Flatten
from keras.layers.convolutional import Conv3D
from keras.layers.pooling import MaxPooling3D
from keras.models import Sequential
visible = Input(shape=(10,12,12,1))
conv1 = Conv3D(8, kernel_size=2, activation='relu')(visible)
pool1 = MaxPooling3D(pool_size=(2, 2, 2))(conv1)
flat1 = Flatten()(pool1)
hidden1 = Dense(10, activation='relu')(flat1)
output = Dense(2, activation='softmax')(hidden1)
model = Model(inputs=visible, outputs=output)