Scikit-learn实例之Pca+Svm人脸识别(AT&T数据集)

最新推荐文章于 2024-08-06 15:06:07 发布

Timmy_Y

最新推荐文章于 2024-08-06 15:06:07 发布

阅读量1.5w

点赞数 34

分类专栏： Python 机器学习 computer vision 机器学习笔记文章标签：人脸识别 PCA SVM scikit-learn python

本文链接：https://blog.csdn.net/mingtian715/article/details/54380623

版权

本文介绍了使用Scikit-learn进行PCA降维和SVM分类来实现人脸识别的方法。通过AT&T数据集进行实验，讨论了主成分数对识别性能的影响，并展示了不同主成分数（如10、5、20）下的测试结果。最后提供了完整的Python代码示例。

摘要由CSDN通过智能技术生成

理论基础

本算法流程就是用主成分分析（Pca）对人脸数据集进行降维，得到数个人脸特征向量。对于任意一个人脸样本，将样本数据向特征向量投影，得到的投影系数作为人脸的特征表示。使用支持向量机（SVM）对这些不同的投影系数向量分类，来进行人脸识别。

（1）人脸识别经典算法：特征脸（Eigenface）人脸识别之特征脸

（2）主成分分析：主成分分析PCA

（3）支持向量机：支持向量机SVM

实例分析

Scikit实例使用的是Labeled Faces in the Wild（LFW）数据集，大约有220M，为了避免下载麻烦或者处理数据较慢，本例使用了英国剑桥大学的AT&T人脸数据：AT&T数据集下载. 该数据集大小不到5M，有40类样本，每类中包含同一个人的10张图像（112*92）。

首先是读入数据集，将每一幅图像拉成一列，组成数据集合（112*92,400），并保存每一列数据对应的人脸标号，以及原图的高度和宽度，为了处理后还原显示。下面为数据读入代码，读入图像使用了opencv的imread函数，并将数据转换了为numpy的array便于后续操作。

PICTURE_PATH = "D:\\Data\\"

def get_Image():
    for i in range(1,41):
        for j in range(1,11):
            path = PICTURE_PATH + "\\s" + str(i) + "\\"+ str(j) + ".pgm"
            img = cv2.imread(path)
            img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
            h,w = img_gray.shape
            img_col = img_gray.reshape(h*w)
            all_data_set.append(img_col)
            all_data_label.append(i)
    return h,w

all_data_set = []
all_data_label = []
h,w = get_Image()

X = array(all_data_set)  
y = array(all_data_label)
n_samples,n_features = X.shape
n_classes = len(unique(y))
target_names = []
for i in range(1,41):
    names = "person" + str(i)
    target_names.append(names)

print("Total dataset size:")
print("n_samples: %d" % n_samples)
print("n_features: %d" % n_features)