使用AI进行人脸检测

最新推荐文章于 2024-06-23 00:17:05 发布

寒冰屋

最新推荐文章于 2024-06-23 00:17:05 发布

阅读量3.5k

点赞数

分类专栏： python 人工智能文章标签： AI Python 人脸识别

原文链接：https://www.codeproject.com/Articles/5275259/Face-Detection-with-AI

版权

人工智能同时被 2 个专栏收录

656 篇文章

订阅专栏

python

267 篇文章

订阅专栏

下载源8.4 KB

介绍

如果您看过《少数派报告》电影，您可能还记得汤姆·克鲁斯（Tom Cruise）走进一家Gap商店的场景。视网膜扫描仪读取他的眼睛，并为他播放定制的广告。好吧，这是2020年。我们不需要视网膜扫描仪，因为我们拥有人工智能（AI）和机器学习（ML）！

在本系列中，我们将向您展示如何使用深度学习进行面部识别，然后基于被识别的面部，使用神经网络语音合成（TTS）引擎播放自定义广告。

我们假设您熟悉AI/ML的基本概念，并且可以找到使用Python的方法。

阶段和工具

本系列的前四篇文章对应于识别人脸的四个阶段，分别是：

人脸检测——检测图像或视频中的所有人脸并提取（裁剪）这些人脸
数据集处理——大多数机器学习过程中包括的一个阶段；提取和解析数据，以及数据集变量的归一化和分类
卷积神经网络（CNN）的设计、实现和训练
利用CNN的预测能力进行实际人脸识别

在介绍人脸识别和TTS时，我们将使用一系列工具：

Python – AI/ML中常用的编程语言
TensorFlow（TF）–核心开源库，可帮助您开发和训练ML模型
Keras –支持核心ML功能的API
NumPy –使用Python进行科学计算的软件包
SK-Image –图像处理算法的集合

检测、提取、调整大小、绘制...

因此，人脸检测——是时候深入研究一些代码了。这是一个实现我们的面部检测器的Python类：

from PIL import Image
from matplotlib import pyplot
from mtcnn import MTCNN
from numpy import asarray
from skimage import io
from util import constant
class MTCnnDetector:

    def __init__(self, image_path):
        self.detector = MTCNN()
        self.image = io.imread(image_path)

该类的名称是MTCnnDetector，因为我们将使用的预定义检测器是MTCNN（多任务卷积神经网络）。这是一种遵循多任务学习原理的CNN。换句话说，它能够同时学习多个任务，从而支持同时检测多个面部。使用MTCNN算法，我们可以检测图像中人脸的边界框，以及每个人脸的5点面部界标（最简单的模型，它可以检测眼睛的边缘和鼻子的底部）。通过将输入输入通过一个CNN来逐步改进检测结果，CNN返回候选边界框及其概率分数。

这是该类的主要方法：

def process_image(self, plot=False):
    faces = self.__detect_face();
    resized_face_list = []
    for f in faces:
        extracted_face = self.__extract_face(f)
        resized_face = self.__resize_img_to_face(extracted_face)
        resized_face_list.append(resized_face)
        if plot:
            self.__plot_face(resized_face)
    return resized_face_list

该方法非常简单：它调用detect_face()方法以从图像中获取所有面孔（其路径是在通过类构造函数输入之前输入的），提取这些面孔并调整其大小，然后返回一个已调整大小的图像列表。此外，如果plot为True ，它将绘制检测到的面部。它使用以下私有方法作为辅助：

def __detect_face(self):
    return self.detector.detect_faces(self.image)

def __extract_face(self, face):
    x1, y1, width, height = face['box']
    x2, y2 = x1 + width, y1 + height
    return self.image[y1:y2, x1:x2]

def __resize_img_to_face(self, face):
    image = Image.fromarray(face)
    image = image.resize((constant.DETECTOR_FACE_DIM, constant.DETECTOR_FACE_DIM))
    return asarray(image)

def __plot_face(self, face):
    pyplot.imshow(face)
    pyplot.show()

因此，detect_face()方法使用self.detector.detect_faces()方法检测面部。extract_face()方法从图像中提取与较早返回的边界框相对应的部分。最后，resize_img_to_face()方法输入图像的先前获得的部分，并将其调整为预定义的尺寸。plot_face()方法绘制结果人脸。

…看看会发生什么

让我们使用来自Wikipedia的示例图像来查看此代码的实际应用。

# Face detector
face_detector = MTCnnDetector(constant.CELEBRITY_VGG_PATH)
resized_faces = face_detector.process_image(plot=True)

在上面的代码中，constant.CELEBRITY_VGG_PATH是一个常量文件，它将用作项目中所有路径和常量的容器。让我们运行代码并检查检测到的面部图。这是我们看到的——使用matplotlib绘制的。

下一步？

在本文中，我们介绍了检测图像中人脸的步骤。如果用于训练CNN的图像没有提前裁剪到被摄对象面部，则此阶段是必要的。在接下来的文章中，我们将讨论有关准备数据集用于输送正确的数据到CNN。敬请关注！