第4关:基于像素主成分的人脸识别模型
任务描述
读取机器学习包中的人脸识别图像数据集,对数据集进行探索分析,对像素特征数据做主成分分析,并提取主成分,要求累计贡献率在95%以上。基于提取的主成分数据,按80%训练和20%测试,构建支持向量机分类模型,输出模型准确率和测试数据集的预测准确率。
编程要求
根据提示,在右侧编辑器补充代码,按照任务要求获取数据,划分数据,利用支持分类向量机输出模型的准确率和测试集的预测准确率。本关的大体内容上与本章节的第3关类似,只是增加了主成分分析的步骤
# -*- coding: utf-8 -*-
#读取机器学习包sklearn内置的人脸图像数据集,
#对像素特征数据做主成分分析,并提取主成分,要求累计贡献率在95%以上。
#基于提取的主成分数据作为输入特征数据,
#按80%训练和20%测试进行随机划分,构建支持向量机分类模型(线性核函数),
#返回模型的准确率rv和测试集的预测准确率rs。
from sklearn.decomposition import PCA #主成分分析模块
def return_values():
#1 读取数据集
import sklearn.datasets
a=sklearn.datasets.fetch_olivetti_faces()
#2 提取数据
X=a.data
Y=a.target
from sklearn.decomposition import PCA
pca=PCA(n_components=0.95)
pca.fit(X)
X1=pca.transform(X)
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(X1,Y,test_size=0.2,random_state=4)
import sklearn.svm as svm
from sklearn.svm import SVC
clf = svm.SVC(kernel='linear')
clf.fit(x_train,y_train)
rv=clf.score(x_train, y_train);
y1=clf.predict(x_test)
r=y1-y_test
rs=len(r[r==0])/len(y1)
return (rv,rs)
#********** End **********#