Python实现PCA降维和KNN人脸识别模型(PCA和KNeighborsClassifier算法)项目实战

376 篇文章 275 订阅

说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

1.项目背景

人脸识别是基于人的脸部特征信息进行身份识别的一种生物识别技术。该技术蓬勃发展,应用广泛,如人脸识别门禁系统、刷脸支付软件等。

人脸识别在本质上是根据每张人脸图像中不同像素点的颜色进行数据建模与判断。人脸图像的每个像素点的颜色都有不同的值,这些值可以组成人脸的特征向量,不过因为人脸图像的像素点很多,所以特征变量也很多,需要利用PCA进行数据降维。

本项目先对人脸数据进行读取和处理,再通过PCA进行数据降维,最后用K近邻算法搭建模型进行人脸识别。

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),,数据项统计如下:

数据集中图片的文件名由4部分组成:

  1. 第1部分是该张图片对应的人脸编号;
  2. 第2部分是固定分隔符“_”;
  3. 第3部分是该张图片在该人脸10张图片中的顺序编号;
  4. 第4部分是文件扩展名“.jpg”。

以“10_0.jpg”为例,10代表编号为10的人的图片,“_”是第1部分和第3部分的分隔符,0代表这个人的10张图片中编号为0的那一张,“.jpg”为文件扩展名。

数据详情如下(部分展示):

3.数据预处理

3.1 图片数据读取

使用os模块列出前5个图片的名称:

从上图可以看到,总共有9个字段。

关键代码:

3.2 特征变量提取

使用Image. convert('L')方法进行特征变量提取:

关键代码:

3.3 图片灰度值数据框显示

使用Pandas工具的DataFrame()方法进行转换:

 

3.4 批量处理图片

通过for循环批量处理图片:

3.5 目标变量提取

通过Image模块的open()方法读取目标变量:

关键代码:

4.探索性数据分析

4.1 显示第一张图片

用Image工具的open()方法进行进行图片的显示:

 

5.特征工程

5.1 数据集拆分

数据集集拆分,分为训练集和测试集,80%训练集和20%测试集。关键代码如下:

5.2 PCA数据降维

使用PCA算法进行数据的降维,输出如下:

 

关键代码如下:

6.构建人脸识别模型

主要使用KNeighborsClassifier算法,用于目标分类。

6.1 模型构建

 

7.模型评估

7.1评估指标及结果

评估指标主要包括准确率、查准率、召回率、F1分值等等。

 

从上表可以看出,人脸识别模型效果良好。

关键代码如下:

7.2 查看是否过拟合

查看训练集和测试集的分数:

 

通过结果可以看到,训练集分数和测试集分数基本相当,所以没有出现过拟合现象。

关键代码:

 

7.3 分类报告

人脸识别模型分类报告:

从上图可以看出,分类为1的F1分值为0.67;分类为2的F1分值为1.00,其它类型的以此类推。

8.结论与展望

综上所述,本项目采用了PCA数据降维和KNN分类模型,最终证明了我们提出的模型效果良好。

# 本次机器学习项目实战所需的资料,项目资源如下:

链接:https://pan.baidu.com/s/1TMdSS-NsYWgeXMlCdW1EVQ 
提取码:kd4a







print(names[0:5])  # 输出前5个文件的名称

from PIL import Image  # 导入图像操作模块

img0 = Image.open('data\\' + names[0])  # 读取第1张图片,注意这里连接文件路径时最好使用两个反斜杠“\\”,以取消单个反斜杠可能带来的特殊含义。
img0.show()  # 显示该图片

# 人脸数据处理 - 特征变量提取
import numpy as np  # 导入科学计算模块

# 对上面读取的图片img0进行灰度转换,参数'L'指转换成灰度格式的图像。在进行灰度处理后,图像的每个像素点的颜色就可以用0~255的数值表示,称为灰度值,
# 其中0代表黑色,255代表白色,(0,255)区间的数值则代表不同程度的灰色。这样便完成了将图像转换成数字的第一步,也是非常重要的一步。
img0 = img0.convert('L')
# 调整图像尺寸为32×32像素,从左上角第1个像素点到右下角最后一个像素点就共有1024个像素点,而每个像素点都对应着一个灰度值(0~255),
# 这样每张图片就都有了1024个特征,每个特征变量的值就是灰度值。这个就是之后构造特征变量搭建模型的基础。
img0 = img0.resize((32, 32))
# 将这1024个像素点的灰度值转换为一个二维数组,并赋给变量arr。其中每个数值都是图像中每个像素点的灰度值,例如,第1行第1个数133就是图像左上角的第1个像素点的灰度值。
arr = np.array(img0)
print('************************输出图片灰度值**************************')
print(arr)

import pandas as pd  # 导入数据处理库


  • 1
    点赞
  • 69
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: MATLAB基于PCAKNN人脸识别是一种常见的图像识别方法。PCA(主成分分析)是一种常用的降维方法,可以将高维数据降至低维,从而减少计算量和提高识别准确率。KNN(K近邻)是一种分类算法,可以根据样本之间的距离来判断新样本属于哪一类。在人脸识别中,首先使用PCA将人脸图像降至低维,然后使用KNN分类器对降维后的数据进行分类,从而实现人脸识别。 ### 回答2: 人脸识别是一种通过技术手段对人脸进行自动识别的技术。用matlab基于PCAKNN算法实现人脸识别,可将人脸图像进行降维处理和分类,实现自动识别功能。下面将详细介绍PCAKNN算法的原理及其在人脸识别中的应用。 第一个算法是主成分分析(Principal Component Analysis,PCA),旨在将高维数据映射到一个低维空间,以降低问题的复杂度。PCA技术是在原始数据的线性变换基础上得到新的特征空间,可用于人脸识别中的人脸建模和人脸检测。PCA处理流程:1.将人脸图像表示为一个向量;2.通过PCA对人脸图像进行降维,得到去除噪声和冗余信息后的图像;3.计算每个人脸的平均人脸和特征脸,并将他们用于人脸分类。 第二个算法是K最近邻算法(K-Nearest Neighbor,KNN),它是一种基于数据的分类算法KNN算法分类的依据是某个未知样本的最近邻居的类别。即从训练集中找到与该样本最近的K个点,并取这K个点中最高频次所属类别作为未知样本的类别。KNN算法处理流程:1.准备数据集和一个未知样本;2.计算每个训练样本与未知样本之间的距离;3.根据距离大小取K个训练样本的类别,并统计各类别出现的频次;4.将出现频次最高的类别作为未知样本的类别。 在人脸识别领域,将PCAKNN算法结合起来使用可以提高识别准确率和效率。通过PCA技术,可以对人脸图像进行降维处理,提高数据处理的速度和精度。而KNN算法则可以有效地分类人脸数据,避免误判和重复性问题。在使用这两个算法进行人脸识别时,需要对训练样本进行多次测试,根据识别的成功率来确定算法的效果。在实际应用中,人脸识别技术已经得到了广泛的应用,例如安全监控、门禁系统、人脸支付等领域。 ### 回答3: PCAKNN是一种常用的人脸识别算法,而Matlab是一种方便易用的数学软件,它也能够基于PCAKNN来进行人脸识别。 在PCA(主成分分析算法中,我们需要先将一组人脸图像数据集进行预处理,即将每张图像转换为一维向量,然后求出它们的协方差矩阵,并对协方差矩阵进行特征值分解。特征值越大的对应的特征向量就是我们需要的主成分,它们构成了一个线性变换矩阵,用于将原始数据映射到新的低维空间中。在这个低维空间中,我们可以计算每个样本的特征向量,也就是它们在主成分方向上的投影,这些特征向量就包含了原始数据的大部分信息,可以用于识别未知人脸图像。 KNN(最近邻分类)算法则是根据一个人脸图像的特征向量和已知人脸图像的特征向量之间的距离来进行分类。在分类过程中,对于待分类的人脸图像,我们先将它转换为特征向量,然后计算它与所有已知人脸图像的特征向量之间的距离,找出距离最近的K个已知人脸图像,并将它们的类别进行统计。待分类的人脸图像就会被归类为距离最近的K个已知人脸图像中占比最多的那个类别。 在Matlab中,可以使用自带的PCAKNN库,来进行人脸识别。首先我们需要读入人脸数据集,并对其进行预处理,将每张图像转换为一维向量,然后将所有向量组合成一个矩阵。接下来,使用PCA库进行主成分分析,计算出变换矩阵,然后将原始数据映射到主成分空间中。最后,使用KNN库进行分类,对于待分类的人脸图像,通过计算其与训练集中所有人脸图像之间的距离,找到距离最近的K个图片,并将它们的类别进行统计,即为待分类图像的类别。 总之,Matlab基于PCAKNN人脸识别是一种较为简单但有效的算法,能够快速地进行人脸识别,并具有较好的识别结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

胖哥真不错

您的鼓励,将是我最大的坚持!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值