基于 OpenVINO™的疲劳驾驶检测方法

该博客介绍了如何使用OpenVINO工具包实现疲劳驾驶检测。通过face-detection-0202模型检测人脸,facial-landmarks-35-adas-0002模型获取人脸关键点,结合Haar级联分类器检测眼睛,当检测到闭眼或嘴部纵横比变化时,系统触发疲劳驾驶警告。整个流程包括模型加载、视频处理和疲劳状态判断。
摘要由CSDN通过智能技术生成

基于 OpenVINO™的疲劳驾驶检测方法

实现思路:

利用openvino预处理模型face-detection-0202检测人脸,提取人脸部分后利用openvino预处理模型facial-landmarks-35-adas-0002检测人脸34个点位,提取出嘴部点位,计算纵横比,同时利用Haar特征训练的级联分类器对人眼进行检测,考虑到精准度,此处用到haarcascade_eye_tree_eyeglasses.xml文件,当人打哈欠或者闭眼时,纵横比发生变化,系统检测到人眼数减少,此时输出"sleppy"文本作为疲劳提示。

FLowchart流程图:
Created with Raphaël 2.3.0 开始 人脸检测 人脸landmarks检测,人眼检测 疲劳判断 结束
代码展示:

模型加载部分

from openvino.inference_engine import IECore
import cv2 as cv
import numpy as np
import math

def sleepiness_detection_demo():
    #人脸检测预处理模型加载
    #初始化推理引擎
    ie = IECore()

    model_xml = "C:/Program Files (x86)/Intel/openvino_2021.4.752/deployment_tools/open_model_zoo/tools/downloader/intel/face-detection-0202/FP32/face-detection-0202.xml"
    model_bin = "C:/Program Files (x86)/Intel/openvino_2021.4.752/deployment_tools/open_model_zoo/tools/downloader/intel/face-detection-0202/FP32/face-detection-0202.bin"

    #加载IR文件
    net = ie.read_network(model=model_xml, weights=model_bin)
    #配置输入输出
    input_blob = next(iter(net.input_info))
    out_blob = next(iter(net.outputs))

    n, c, h, w = net.input_info[input_blob].input_data.shape

    #加载可执行网络
    exec_net = ie.load_network(network=net, device_name="CPU")

    #人脸检测点预处理模型加载
    lm_xml = "C:/Program Files (x86)/Intel/openvino_2021.4.752/deployment_tools/open_model_zoo/tools/downloader/intel/facial-landmarks-35-adas-0002/FP32/facial-landmarks-35-adas-0002.xml"
    lm_bin = "C:/Program Files (x86)/Intel/openvino_2021.4.752/deployment_tools/open_model_zoo/tools/downloader/intel/facial-landmarks-35-adas-0002/FP32/facial-landmarks-35-adas-0002.bin"

    lm_net = ie.read_network(model=lm_xml, weights=lm_bin)
    lm_input_blob = next(iter(lm_net.input_info))
    lm_output_blob = next(iter(lm_net.outputs))

    ln, lc, lh, lw = lm_net.input_info[lm_input_blob].input_data.shape

    lm_exec_net = ie.load_network(network=lm_net, device_name="CPU")

    #人眼检测(利用opencv自带检测器)
    #创建一个级联分类器对象,加载xml检测器
    eye_xml = cv.CascadeClassifier('C:/Program Files (x86)/Intel/openvino_2021.4.752/opencv/etc/haarcascades/haarcascade_eye_tree_eyeglasses.xml')
    

读取、处理视频输入(此处为摄像头输入)
当系统检测人眼数少于2(即两只眼睛都闭上时)或者嘴部纵横比大于0.6(即打哈欠)时在脸部区域上输出"sleepy"字样,其余时间输出"normal"字样

    #捕捉摄像头的帧
    cap = cv.VideoCapture(0, cv.CAP_DSHOW)
    while True:
        #读取视频每一帧
        ret, frame = cap.read()
        if ret is not True:
            break
        image = cv.resize(frame, (w, h))
        # 转置 若升维度(HWC->NCHW):np.expand_dims(img, 0)
        image = image.transpose(2, 0, 1)
        #推理 将image变为四维
        res = exec_net.infer(inputs={input_blob: [image]})
        #获得推理计算后的输出
        res = res[out_blob]

        ih, iw, ic = frame.shape
        for obj in res[0][0]:
            if obj[2] > 0.25:
                #将浮点数转换为实际宽高
                xmin = int(obj[3] * iw)
                ymin = int(obj[4] * ih)
                xmax = int(obj[5] * iw)
                ymax = int(obj[6] * ih)
                #防止越界
                if xmin < 0:
                    xmin = 0
                if ymin < 0:
                    ymin = 0
                if xmax >= iw:
                    xmax = iw - 1
                if ymax >= ih:
                    ymax = ih - 1
                cv.rectangle(frame, (xmin, ymin), (xmax, ymax), (0, 255, 255), 2, 8)
                #提取人脸部分,获取人脸检测点
                roi = frame[ymin:ymax, xmin:xmax, :]
                rh, rw, rc = roi.shape
                roi_img = cv.resize(roi, (lw, lh))
                roi_img = roi_img.transpose(2, 0, 1)
                lm_res = lm_exec_net.infer(inputs={lm_input_blob: [roi_img]})
                prob_landmarks = lm_res[lm_output_blob]
                #创建空list,存储嘴部检测点的坐标值
                marklist = []
                for index in range(0, len(prob_landmarks[0]), 2):
                    x = np.int(prob_landmarks[0][index] * rw)
                    y = np.int(prob_landmarks[0][index+1] * rh)

                    if (index == 16 or index == 18 or index == 20 or index == 22):
                        marklist.append(x)
                        marklist.append(y)

                #计算嘴部纵横比
                dist_w = math.sqrt(math.pow(marklist[2]-marklist[0], 2) + math.pow(marklist[3]-marklist[1], 2))
                dist_h = math.sqrt(math.pow(marklist[6]-marklist[4], 2) + math.pow(marklist[7]-marklist[5], 2))
                rate = dist_h / dist_w
                #灰度处理
                face_gray = cv.cvtColor(roi, cv.COLOR_BGR2GRAY)
                #眼睛识别
                eyes = eye_xml.detectMultiScale(face_gray)
                #判断疲劳并作出输出
                if (len(eyes) < 2 or rate > 0.6):
                    cv.putText(frame, "sleepy", (xmin, ymin), cv.FONT_HERSHEY_COMPLEX, 1, (0, 255, 0), 2)
                else:
                    cv.putText(frame, "normal", (xmin, ymin), cv.FONT_HERSHEY_COMPLEX, 1, (0, 255, 0), 2)
        cv.imshow("sleepiness_detection_demo", frame)
        #停留时读取键值,按Esc键退出
        c = cv.waitKey(1)
        if c == 27:
            break
    cap.release()
    
if __name__ == "__main__":
    sleepiness_detection_demo()
运行结果

在这里插入图片描述
闭眼时
在这里插入图片描述
打哈欠时

手把手讲授如何搭建成功OpenVINO框架,并且使用预训练模型快速开发超分辨率、道路分割、汽车识别、人脸识别、人体姿态和行人车辆分析。得益于OpenVINO框架的强大能力,这些例子都能够基于CPU达到实时帧率。课程的亮点在于在调通Demo的基础上更进一步:一是在讲Demo的时候,对相关领域问题进行分析(比如介绍什么是超分辨率,有什么作用)、预训练模型的来龙去脉(来自那篇论文,用什么训练的)、如何去查看不同模型的输入输出参数、如何编写对应的接口参数进行详细讲解;二是基本上对所有的代码进行重构,也就是能够让例子独立出来,并且给出了带有较详细注释的代码;三是注重实际运用,将Demo进一步和实时视频处理框架融合,形成能够独立运行的程序,方便模型落地部署;四是重难点突出、注重总结归纳,对OpenVINO基本框架,特别是能够提高视频处理速度的异步机制和能够直接部署解决实际问题的骨骼模型着重讲解,帮助学习理解;五是整个课程准备精细,每一课都避免千篇一律,前一课有对后一课的预告,后一课有对前一课的难点回顾,避免学习过程中出现突兀;六是在适当的时候拓展衍生,不仅讲OpenVINO解决图像处理问题,而且还补充图像处理的软硬选择、如何在手机上开发图像处理程序等内容,帮助拓展视野,增强对行业现状的了解。基本提纲:1、课程综述、环境配置2、OpenVINO范例-超分辨率(super_resolution_demo)3、OpenVINO范例-道路分割(segmentation_demo)4、OpenVINO范例-汽车识别(security_barrier_camera_demo)5、OpenVINO范例-人脸识别(interactive_face_detection_demo)6、OpenVINO范例-人体姿态分析(human_pose_estimation_demo)7、OpenVINO范例-行人车辆分析(pedestrian_tracker_demo)8、NCS和GOMFCTEMPLATE9、课程小结,资源分享
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值