【class12】人工智能初步（人脸识别（2））

最新推荐文章于 2024-10-16 21:06:05 发布

fmc121104

最新推荐文章于 2024-10-16 21:06:05 发布

阅读量1.2k

点赞数 36

文章标签：网络服务器人工智能

本文链接：https://blog.csdn.net/fmc121104/article/details/139048345

版权

通过昨天的学习，我们已经完成了“口罩佩戴检测”系统的第一步——获取具有人脸识别功能的接口。
在今天的课程中，我们将学习如何对图像进行人脸检测，实现这个过程需要两步：
1. 使用base64编码方法将图片转换成字符串；
2. 使用detect方法进行人脸检测：
让我们先来学习第一步～

detect（人脸检测）接口要求图片必须使用base64编码。
所以在开始使用detect接口前，先来学习一下将图片转化为字符串的方法——base64编码。

BASE64编码

定义

Base64（基底64）是一种基于64个可打印字符来表示数据的方法，是一种编码方式。

隐喻

我们使用的拼音可以看作是一种基于26个可打印字符（26个字母）来表示所有汉字的方法。

Base64 编码

Base64 编码将二进制数据转化为指定的64个可读字符，这样做能够在一定程度上缩小数据的长度，方便记录存储。
数据不再是0、1组成的二进制，而是一些常用的字符。

不仅如此，base64还可以将非文本内容如图片、视频等数据，转换为文本形式。
这在只支持文本传输的协议下，非常实用。

Base64---代码组成

完成这个过程的代码需要3步：
1. 打开并读取指定的图片文件；
2. 利用base64模块进行编码；
3. 将编码结果转化为字符串；

Ps：

除了 r 和 rb，在 Python 中还有其他一些打开文件时可以使用的模式：

w: 写入模式 (write mode)
1. 使用这种模式打开文件时，如果文件不存在，则创建文件；如果文件已经存在，则先清空文件内容，然后开始写入新的内容。

with open("example.txt", "w") as file:

file.write("Hello, world!")

a: 追加模式 (append mode)

2.使用这种模式打开文件时，如果文件不存在，则创建文件；如果文件已经存在，则将新的内容追加到文件的末尾。

with open("example.txt", "a") as file:

file.write("Appending new content!")

r+: 读写模式 (read-write mode)

3.使用这种模式打开文件时，可以同时读取和写入文件。文件的指针会位于文件的开头，可以读取和写入文件的任意位置。

with open("example.txt", "r+") as file:

content = file.read()

file.write("\nAdding new content!")

w+: 读写模式 (write-read mode)

4.使用这种模式打开文件时，如果文件不存在，则创建文件；如果文件已经存在，则先清空文件内容，然后可以同时读取和写入文件。

with open("example.txt", "w+") as file:

file.write("Writing and reading!")

file.seek(0) # 移动文件指针到文件开头

content = file.read()

a+: 追加和读取模式 (append-read mode)

5.使用这种模式打开文件时，如果文件不存在，则创建文件；如果文件已经存在，则可以在文件的末尾追加内容，并且可以读取文件内容。

with open("example.txt", "a+") as file:

file.write("Appending and reading!")

file.seek(0) # 移动文件指针到文件开头

content = file.read()

这些是最常用的文件打开模式，它们可以根据需要进行组合使用，以满足不同的文件操作需求。

分析代码：

导入模块

导入base64模块，用来为程序提供base64编码的支持。
base64 为python自带的模块，不需要安装即可直接使用。

图片路径

设定图片路径。
选定要转换的图片位置，以字符串的形式存储在变量img_path中。

打开图片

使用open函数打开img_path路径下的图片，并存储在变量file中。
“rb” 是read binary 的缩写，指以读取二进制的模式打开文件。

读取内容

利用file的read()方法读取文件中的内容，并将二进制结果存储在res 变量中。

对数据进行base64编码

使用 base64.b64encode()函数，将res变量中的内容转换为base64编码后的数据。
并存储在img变量中。

将编码结果转化为字符串

编码后的数据还不能被detect接口直接使用，我们需要将它转换为字符串形式。

利用str()函数可以将数据强制转换为字符串。为了避免乱码，我们需要将img中的数据以一种通用的编码——“utf-8”，进行转换。

人脸检测（detect）的必选参数

完成了将图片转换为字符串的步骤，我们就得到了detect的两个必选的参数：

1. image

要识别的图片：图片的字符串数据

2. imageType

该图片的类型：BASE64

接下来，我们进入人脸检测的第二步，学习一下人脸检测接口detect()的用法。

创建客户端

通过昨天学习的内容，将应用密钥作为参数传递给 AipFace，生成提供人脸识别功能的客户端client。
通过client变量，可以使用人脸检测接口detect，即client.detect。

编码要检测的图片

通过base64，将图片文件转换为字符串。
转换后的结果存储在img变量中，该变量会作为client.detect方法传入的第一个参数。

设定图片的类型

设定图片类型为 BASE64 格式。
创建变量 img_type 用来存储待检测图片的类型"BASE64"，这个变量会作为第二个参数传递给 client.detect

使用detect方法

存储图片的img变量与说明图片类型的img_type变量准备完成后，就可以调用 client.detect 方法进行人脸检测。

对指定一张图片进行人脸检测需要执行下面的步骤：

1. 获取被base64编码的图片数据；

2. 设定图片的类型"BASE64"；

3. 将图片数据、类型传递给client.detect中，对人脸进行检测；

4. 提取检测结果中的信息，并输出。

注意：输出变量中的log_id是一个随机数，每次运行都会发生改变。

检测结果

接下来我们分析一下人脸检测得到的信息，它被存储在ret_data变量中。
输出该变量，用来获取存储：
【调用接口信息】;
【检测结果】;
两部分内容的字典。

调用接口信息

在 ret_data 字典中：
ret_data['error_code'] 记录错误代码，为0时，表示检测成功。
ret_data['error_msg'] 记录错误信息，'SUCCESS' 表示检测成功。

人脸检测结果

ret_data['result'] 用字典记录了人脸检测的结果，其中：
ret_data['result']['face_num'] 中记录识别到的人脸数量；
ret_data['result']['face_list'] 中用列表存储每张人脸的信息；

让我们对ret_data变量中的检测结果进行拆解：
1. 利用ret_data['error_msg']判断检测是否成功；
2. 利用ret_data['result']['face_num']获取人脸数量
3. 利用ret_data['result']['face_list']获取面孔信息

# 导入AipFace类

from aip import AipFace

# 以字符串的形式存储密钥

APP_ID = '10252021'

API_KEY = 'ZHe7788sh11GEjIAdEKeY'

SECRET_KEY = 'JMMzHe7788BUSH1ZhEnM1YUEhh'

# 将密钥信息传递给AipFace生成客户端，并将结果存储在client中

client = AipFace(APP_ID, API_KEY, SECRET_KEY)

# 导入base64模块

import base64

# 图片的路径

img_path = "/User/img/pic.png"

# 以rb的方式读取图片

with open(img_path, "rb") as file:

# 读取图片内容

res = file.read()

# 图片文件进行base64编码

img = base64.b64encode(res)

# 图片转换为字符串

img = str(img, 'utf-8')

# 设定图片类型为base64类型

img_type = "BASE64"

# 带参数调用人脸检测，识别结果命名为ret_data

ret_data = client.detect(img, img_type)

# 判断检测是否成功：错误信息是否为SUCCESS

if ret_data['error_msg'] == 'SUCCESS':

print('识别到的人脸数量为：')

# 若检测成功，输出识别到的人脸数量

print(ret_data['result']['face_num'])

print('检测到的面孔信息：')

# 输出面孔信息

print(ret_data['result']['face_list'])

# 否则输出检测失败

else:

print('检测失败！')

识别到的人脸数量为：

检测到的面孔信息：

[{'face_token': 'cd3e33fe4c6066a843d15864513bfc8b', 'location': {'left': 287.07, 'top': 164.24, 'width': 73, 'height': 68, 'rotation': 25}, 'face_probability': 1, 'angle': {'yaw': -57.59, 'pitch': -0.55, 'roll': 22.8}}]

通过刚才的练习可以发现，现在的程序最多只能从图中识别到一个面孔信息。
这是因为AipFace的人脸检测功能默认只识别一个人脸信息，若要增大识别的数量，需要在使用detect时，传入 options 参数进行配置。

Ps：

options 参数

detect 提供一些可选的参数用来配置接口功能，它们被存储在名为options的字典中。
除了增加识别数量，options也提供诸如年龄检测、美丑打分、性别判断等其它属性识别的功能。

代码结构

options 参数以字典的形式存储配置信息。其中：
options['max_face_num']，配置最多识别的人脸数目为10；
options['face_field']，配置需要识别的面部属性为质量（quality）与年龄（age）。
它将作为第三个参数传递给client.detect。

分析代码：

options 字典

创建一个字典，并把它存储在变量options中。
options 字典中存储的配置信息，作为第三个参数传递给client.detect。

设置人脸数量

在 options 字典中，加入一个键为'max_face_num'的元素，该元素对应的整数值就是程序能够从图片中识别到的最多人脸数目。
max_face_num 可设置的范围为 1～10。

获取面部属性

在 options 字典中，加入一个键为'face_field'的元素，它的值为字符串存储的属性名称。
face_field 可以同时设置多种属性，名称之间以逗号隔开，且不能有空格。
在这里，我们配置了脸部信息的“识别质量”与“年龄”功能。

检查识别结果

输出识别到的人脸数目。
可以看到，添加了options参数以后，能够正常识别到图片中所有的人脸。

在使用detect接口时，可以通过options进行功能配置：
1. 创建字典options；
2. 为options字典添加max_face_num键，设置最大识别数；
3. 为options字典添加face_field键，设置面部属性；
4. 将options作为第3个参数传递给detect。

此时重新对图片进行检测，就可以检测到全部的人脸信息了

人脸属性信息

配置options参数不仅让我们成功检测到图中的所有面孔，并依次将每个面孔的【位置信息】、【检测质量】与【年龄预测】等信息，记录在ret_data['result']['face_list']这些字典中。

利用这些面孔信息，接下来我们需要对程序进行优化，使检测结果可视化。
比如，我们可以通过检测到的位置信息来修改图片，直接标注出人脸的位置。

下节预告

在下节课的学习中，我们将完成项目的第三部。
通过 Python 图片处理模块 pillow，将检测到的人脸位置，用矩形在图片中标注出来。

fmc121104

关注

36
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫