python识别几何图形_如何使用Python进行面部识别?

全文共2841字,预计学习时长8分钟

a08b87d6277f9e2f4f8a9da4116ce523b999f346.jpeg?token=979dac93940a12acdf1ae92f701b25f2图源:unsplash

本文将介绍图像处理中的一些重要概念,除了具体解释每个步骤之外,还将提供一个在Python中使用Cv2和DLib库轻松进行人脸识别的项目。

感兴趣区域

在使用图像进行面部分析时,最重要的概念之一是定义感兴趣区域(ROI),我们必须在图像中定义一个特定的部分,在那里筛选或执行一些操作。

例如,如果我们需要筛选汽车的车牌,我们的感兴趣领域只停留在车牌上,那么街道、车身和图片中出现的任何东西都只是辅助部分。在本例中,我们将使用opencv库,该库支持对图像进行分区并帮助我们确定感兴趣领域。

Haar库

本项目中将使用现成的分类器:级联的Haar分类器,这种特定的分类器将始终适用于灰度图像。

503d269759ee3d6db8ca821d484a61254e4adebf.jpeg?token=796657f6709368df5bebe83f1bbca134

该算法生成了一个几何图形,该几何图形将识别与我们所分析的相似点。因此在本例中,它将尝试寻找人脸图案,即眼睛、鼻子和嘴巴。这种分析方法最大的问题是产生幻想性视错觉。

9345d688d43f87945bc1c578df4702f31bd53a09.jpeg?token=737e6c6fabac70f96440e80a1d73e58b图源:unsplash

你看到的是人眼还是几扇窗户?在希腊词源学中,幻想性视错觉是一种人类的特征。从童年起,我们的大脑就被编程来识别物体、图像中的人脸。利用我们先前获得的经验,我们自己的大脑会根据我们所认识到的“人类”特征来寻找一种模式,增加新的人脸面孔。

使用Haar人脸特征分类器

用以下图像为例:

a8014c086e061d9586c17ef477a806d660d9cade.jpeg?token=28d5b55e2fe66192e5ba1924049fb429

来看看识别这张图片中的人脸代码:

import cv2

group_of_people_image = cv2.imread('images/image7.jpg')

frontal_face_classifier = cv2.CascadeClassifier('classifier/haarcascade_frontalface_default.xml')

image_in_gray_scale = cv2.cvtColor(group_of_people_image,cv2.COLOR_BGR2GRAY)

faces = frontal_face_classifier.detectMultiScale(image=image_in_gray_scale,scaleFactor=1.3, minNeighbors=6)

for (x_axis, y_axis, weight,height) in faces:

cv2.rectangle(group_of_people_image,(x_axis, y_axis), (x_axis + weight, y_axis + height), (255, 0, 0), 2)

该算法将图像转换为灰度图像,如前所述,这是分类器操作的一个基本步骤,然后我们使用dectedMultiScale函数搜索图像中的人脸,并通过绘制矩形来显示图像的位置,当定位人脸时结果如下:

b3119313b07eca8067b847ce9f7f9bdaa1448338.jpeg?token=97945f723d150c8bcdf4bdfff660399f

我们能够准确地分析两张出现的脸(采用矩形的方式将人脸框起来),有两个人完全正面地露出他们的脸,人脸完全显现,所以我们可以清楚地看到他的脸;另一个人只露出了面部的一部分,所以我们没有得到准确的信息来确认这是一张完整的人脸。

面部特征检测

Dlib是一个拥有一些分类器的库,可以帮助我们检测人脸的某些部分,例如:眼睛、眉毛、鼻子和洋娃娃的区域。以下图为例:

cb8065380cd7912305a41e3da0685585b3b78092.jpeg?token=fc17f6d6ee9ed49e43864088e002b3b5

现在,使用算法来识别图像中的面部特征点:

import cv2

import dlib

import numpy as np

initial_image = cv2.imread('images/image9.jpg')

initial_image_in_rgb = cv2.cvtColor(initial_image,cv2.COLOR_BGR2RGB)

reference_image = initial_image_in_rgb.copy()

classifier_path = dlib.shape_predictor('classifier/shape_predictor_68_face_landmarks.dat')

frontal_face_detector = dlib.get_frontal_face_detector()

rectangles =frontal_face_detector(initial_image,1)

for k, d inenumerate(rectangles):

cv2.rectangle(reference_image,(d.left(), d.top()), (d.right(), d.bottom()), (255, 255, 0), 2)

landmarks = []

for rectangle in rectangles:

landmarks.append(np.matrix([[p.x, p.y] for p inclassifier_path(reference_image,rectangle).parts()]))

for landmark in landmarks:

for index, point inenumerate(landmark):

point_center = (point[0, 0], point[0, 1])

cv2.circle(reference_image,point_center, 3, (255, 255, 0), -1)

cv2.putText(reference_image,str(index), point_center, cv2.FONT_HERSHEY_COMPLEX, 3, (255, 255, 255), 2)

我们使用的是人脸68个特征分类器,它试图更精确地理解点面,这给了我们更多的选择去分析结果,其缺点是速度有点慢。所以必须划定一个矩形来确定我们的脸可能在哪里,特征是我们可以识别的人脸特征,包括脸、嘴、眼睛、眉毛。

一旦用矩形的方式框出了脸,就可以使用功能部件将这些特征返回,最后将得到一些可视化的东西去生成一个带有面部点的图像。结果是:

d1a20cf431adcbef6ff5091fa0f322daa2cc9f4c.jpeg?token=6ea2dbfb23443ec5c17c6c6455eacebd

这些点对于帮助识别表情很重要,例如我们可以识别出这个男孩睁着眼睛,闭着嘴巴。把这看作是一种情绪的表现,可以说这个男孩很焦虑。当一个人微笑时,它可以帮助理解这种情绪可能表达的是幸福。

上述例子向我们展示了,Python可以识别出我们感兴趣的区域,在本文中就是人脸识别。这个项目还可以扩展到使用机器学习来检测,探究图像中的人是否感到快乐、悲伤或者忧虑。

包含所有内容的项目可从以下网址获得:https://github.com/LimaGuilherme/facial-recognize

f603918fa0ec08fa4b5cd93452b2316a54fbdaac.jpeg?token=d20be9684184a9d1b153b802848d0741

留言点赞关注

我们一起分享AI学习与发展的干货

如转载,请后台留言,遵守转载规范

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值