【图像处理】 -040 Dlib 深度人脸检测

35 篇文章 3 订阅
16 篇文章 1 订阅

【图像处理】 -040 Dlib 深度人脸检测

1 简介

  Dlib中实现的深度人脸检测是基于MMOD(Maximum-Margin Object Detector(MMOD)),CNN结构。

2 使用dlib实现深度人脸检测

// Dlib_HOG.cpp : 此文件包含 "main" 函数。程序执行将在此处开始并结束。
//

#include <iostream>
#include <string>
#include <fstream>
#include "opencv2/opencv.hpp"
#include "../OpenCV_Harr/OpenCV_Harr/HighPerformanceTimer.hpp"
#include <dlib/opencv.h>
#include <dlib/image_processing.h>
#include <dlib/image_processing/frontal_face_detector.h>
#include <dlib/image_processing.h>
#include <dlib/dnn.h>
#include <dlib/data_io.h>

// Network Definition
/
template <long num_filters, typename SUBNET> using con5d = dlib::con<num_filters, 5, 5, 2, 2, SUBNET>;
template <long num_filters, typename SUBNET> using con5 = dlib::con<num_filters, 5, 5, 1, 1, SUBNET>;

template <typename SUBNET> using downsampler = dlib::relu<dlib::affine<con5d<32, dlib::relu<dlib::affine<con5d<32, dlib::relu<dlib::affine<con5d<16, SUBNET>>>>>>>>>;
template <typename SUBNET> using rcon5 = dlib::relu<dlib::affine<con5<45, SUBNET>>>;

using net_type = dlib::loss_mmod<dlib::con<1, 9, 9, 1, 1, rcon5<rcon5<rcon5<downsampler<dlib::input_rgb_image_pyramid<dlib::pyramid_down<6>>>>>>>>;

//读取待检测文件列表
std::vector<std::string> ReadImgList(std::string& imglistfilename)
{
    std::vector<std::string> imgs;
    std::ifstream imglistfile(imglistfilename, std::ifstream::in);
    std::string line;
    while (getline(imglistfile, line))//按行读取
    {
        imgs.push_back(line);
    }
    return imgs;
}


int main(int argc, char** argv)
{
    if (argc < 3)
    {
        std::cout << "Please use this exe like this:" << std::endl;
        std::cout << "OpenCV_Harrx.exe imglist.txt outputpath" << std::endl;
        system("pause");
    }
    std::string imglistfile(argv[1]);
    std::string outputpath(argv[2]);

    std::string mmodModelPath = "./models/mmod_human_face_detector.dat";
    net_type mmodFaceDetector;
    dlib::deserialize(mmodModelPath) >> mmodFaceDetector;

    std::cout << "load" << std::endl;
    //加载待检测的图片路径列表
    std::vector<std::string> imgs = ReadImgList(imglistfile);

    //创建计时器对象
    char* pTimerName = (char*)"Dlib-MMOD";
    CHighPerformanceTimer* pTimer = new CHighPerformanceTimer(pTimerName, 9, true);

    std::ofstream of(outputpath, std::ofstream::out);
    //循环处理所有图片
    for (int i = 0; i < imgs.size(); i++)
    {
        //读取图片
        cv::Mat img = cv::imread((char*)imgs[i].c_str());

        //由于在实际应用中,我使用opencv进行图像加载,所以这里计时的时候统计了
        //图像数据转换的时间,实际上,统计检测时间即可
        pTimer->Reset();//计时器清零

        int frameHeight = img.rows;
        int frameWidth = img.cols;
        int inHeight = 300;
        int inWidth = 0;
        if (!inWidth)
            inWidth = (int)((frameWidth / (float)frameHeight) * inHeight);

        float scaleHeight = frameHeight / (float)inHeight;
        float scaleWidth = frameWidth / (float)inWidth;

        cv::Mat frameDlibMmodSmall;
        resize(img, frameDlibMmodSmall, cv::Size(inWidth, inHeight));
        // Convert OpenCV image format to Dlib's image format
        dlib::cv_image<dlib::bgr_pixel> dlibIm(frameDlibMmodSmall);
        dlib::matrix<dlib::rgb_pixel> dlibMatrix;
        dlib::assign_image(dlibMatrix, dlibIm);

        // Detect faces in the image
        std::vector<dlib::mmod_rect> faceRects = mmodFaceDetector(dlibMatrix);
        std::vector<cv::Rect> faces;
        for (size_t i = 0; i < faceRects.size(); i++)
        {
            int x1 = (int)(faceRects[i].rect.left() * scaleWidth);
            int y1 = (int)(faceRects[i].rect.top() * scaleHeight);
            int x2 = (int)(faceRects[i].rect.right() * scaleWidth);
            int y2 = (int)(faceRects[i].rect.bottom() * scaleHeight);
            cv::Rect face;
            face.x = x1;
            face.y = y1;
            face.width = x2 - x1;
            face.height = y2 - y1;
            faces.push_back(face);
        }

        double dt = pTimer->GetTime();//统计检测用时

        //输出结果文件,方便日后统计,按照文件名,检测用时,人脸数,各个人脸位置按行输出。
        of << imgs[i] << " " << dt << "s " << faces.size() << " ";
        std::cout << imgs[i] << " " << dt << "s " << faces.size() << " ";
        //显示检测结果
        for (int j = 0; j < faces.size(); j++)
        {
            cv::rectangle(img, faces[j], cv::Scalar(0, 0, 255), 2);
            of << faces[j] << " ";
            std::cout << faces[j] << " ";
        }
        of << std::endl;
        std::cout << std::endl;
        cv::imshow("Dlib-MMOD", img);
        int key = cv::waitKey();
        if (key == 's')
            break;
    }
    of.close();
    delete pTimer;
    pTimer = 0;
    return 0;
}


3 检测效果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4 分析

  • 对小人脸检测效果不佳。
  • 在GPU上实现速度极快,约5ms一张图,但CPU上实现检测速度极慢,>1.5s一张。
  • 检测精度有待提高,需要重新训练模型。
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
OpenCV(Open Source Computer Vision Library)是一款开源的计算机视觉库,专门为图像和视频处理任务设计,广泛应用于学术研究、工业应用以及个人项目中。以下是关于OpenCV的详细介绍: 历史与发展 起源:OpenCV于1999年由英特尔公司发起,旨在促进计算机视觉技术的普及和商业化应用。该项目旨在创建一个易于使用、高效且跨平台的库,为开发者提供实现计算机视觉算法所需的基础工具。 社区与支持:随着时间的推移,OpenCV吸引了全球众多开发者和研究人员的参与,形成了活跃的社区。目前,OpenCV由非盈利组织OpenCV.org维护,并得到了全球开发者、研究机构以及企业的持续贡献和支持。 主要特点 跨平台:OpenCV支持多种操作系统,包括但不限于Windows、Linux、macOS、Android和iOS,确保代码能够在不同平台上无缝运行。 丰富的功能:库中包含了数千个优化过的函数,涵盖了计算机视觉领域的诸多方面,如图像处理(滤波、形态学操作、色彩空间转换等)、特征检测与描述(如SIFT、SURF、ORB等)、物体识别与检测(如Haar级联分类器、HOG、DNN等)、视频分析、相机校正、立体视觉、机器学习(SVM、KNN、决策树等)、深度学习(基于TensorFlow、PyTorch后端的模型加载与部署)等。 高效性能:OpenCV代码经过高度优化,能够利用多核CPU、GPU以及特定硬件加速(如Intel IPP、OpenCL等),实现高速图像处理和实时计算机视觉应用。 多语言支持:尽管OpenCV主要使用C++编写,但它提供了丰富的API绑定,支持包括C、Python、Java、MATLAB、JavaScript等多种编程语言,方便不同领域的开发者使用。 开源与免费:OpenCV遵循BSD开源许可证发布,用户可以免费下载、使用、修改和分发库及其源代码,无需担心版权问题。 架构与核心模块 OpenCV的架构围绕核心模块构建,这些模块提供了不同层次的功能: Core:包含基本的数据结构(如cv::Mat用于图像存储和操作)、基本的图像和矩阵操作、数学函数、文件I/O等底层功能。 ImgProc:提供图像预处理、滤波、几何变换、形态学操作、直方图计算、轮廓发现与分析等图像处理功能。 HighGui:提供图形用户界面(GUI)支持,如图像和视频的显示、用户交互(如鼠标事件处理)以及简单的窗口管理。 VideoIO:负责视频的读写操作,支持多种视频格式和捕获设备。 Objdetect:包含预训练的对象检测模型(如Haar级联分类器用于人脸检测)。 Features2D:提供特征点检测(如SIFT、ORB)与描述符计算、特征匹配与对应关系估计等功能。 Calib3d:用于相机标定、立体视觉、多视图几何等问题。 ML:包含传统机器学习算法,如支持向量机(SVM)、K近邻(KNN)、决策树等。 DNN:深度神经网络模块,支持导入和运行预训练的深度学习模型,如卷积神经网络(CNN)。 应用领域 OpenCV广泛应用于: 科研与教育:作为计算机视觉教学和研究的基础工具,OpenCV简化了算法原型开发与验证过程。 工业自动化:在视觉检测、机器人导航、产品质量控制等工业场景中,OpenCV用于实时图像分析与决策。 安防监控:用于人脸识别、行人检测、行为分析等智能监控系统。 医疗影像分析:在医疗领域,OpenCV可用于医学图像处理、病灶检测、诊断辅助等应用。 自动驾驶:在车辆视觉感知系统中,OpenCV用于道路标志识别、障碍物检测、车道线识别等任务。 多媒体应用:如图像编辑软件、AR/VR应用、游戏开发等,利用OpenCV进行图像和视频处理。 物联网与嵌入式系统:在资源受限的嵌入式设备上,OpenCV提供轻量级的计算机视觉解决方案。 学习与社区资源 OpenCV拥有丰富的官方文档、教程、示例代码以及活跃的开发者社区,包括GitHub、StackOverflow、官方论坛等,为学习和使用OpenCV提供了有力支持。此外,有许多书籍、在线课程、博客文章和研讨会专门讲解OpenCV的使用和计算机视觉技术。 综上所述,OpenCV作为一款功能强大、高效、跨平台且开源的计算机视觉库,为开发者提供了实现各类图像和视频处理任务所需的工具箱,其广泛的应用领域和活跃的社区支持使之成为计算机视觉领域不可或缺的开发工具。
OpenCV是一个开源的计算机视觉库,它提供了很多用于图像处理和模式识别的功能。而Dlib是一个基于C++的机器学习库,主要用于人脸检测和人脸识别任务。 在使用OpenCV进行人脸检测时,我们可以使用Haar特征分类器或基于神经网络的深度学习模型。Haar特征分类器使用像素值的差值来检测人脸,它可以通过训练来识别人脸的不同部分,例如眼睛、鼻子和嘴巴等。 而Dlib库提供了一个名为dlib.get_frontal_face_detector()的方法,可以用于检测图像中的人脸。它使用的是基于HOG(方向梯度直方图)特征和级联分类器的方法,可以在不同的角度和尺度下准确地检测人脸。 当我们想要将OpenCV和Dlib结合起来进行人脸识别时,我们可以使用Dlib提供的人脸检测器检测图像中的人脸,然后使用OpenCV进行图像处理和特征提取,最后使用Dlib的人脸识别模型对人脸进行识别。 在这个过程中,我们可以使用OpenCV的函数来加载和处理图像,然后使用Dlib的检测器来检测图像中的人脸,接着使用Dlib的人脸识别模型来比对和识别人脸。 综上所述,OpenCV和Dlib结合使用可以实现人脸检测和人脸识别的功能。OpenCV提供了图像处理和特征提取的功能,而Dlib提供了准确的人脸检测和人脸识别模型。这种结合可以在人脸识别、人脸验证和人脸表情分析等领域发挥重要作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值