头歌：图像识别案例在线实验闯关

最新推荐文章于 2023-06-10 21:19:50 发布

皮蛋solo粥83

最新推荐文章于 2023-06-10 21:19:50 发布

阅读量415

点赞数 2

文章标签：机器学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_59964724/article/details/130992530

版权

第4关：基于像素主成分的人脸识别模型

任务描述

读取机器学习包中的人脸识别图像数据集，对数据集进行探索分析，对像素特征数据做主成分分析，并提取主成分，要求累计贡献率在95％以上。基于提取的主成分数据，按80%训练和20%测试，构建支持向量机分类模型，输出模型准确率和测试数据集的预测准确率。

编程要求

根据提示，在右侧编辑器补充代码，按照任务要求获取数据，划分数据，利用支持分类向量机输出模型的准确率和测试集的预测准确率。本关的大体内容上与本章节的第3关类似，只是增加了主成分分析的步骤

# -*- coding: utf-8 -*-
#读取机器学习包sklearn内置的人脸图像数据集，
#对像素特征数据做主成分分析，并提取主成分，要求累计贡献率在95％以上。
#基于提取的主成分数据作为输入特征数据，
#按80%训练和20%测试进行随机划分，构建支持向量机分类模型(线性核函数)，
#返回模型的准确率rv和测试集的预测准确率rs。
from sklearn.decomposition import PCA #主成分分析模块
def return_values():
    #1 读取数据集
    import sklearn.datasets
    a=sklearn.datasets.fetch_olivetti_faces()
    #2 提取数据
    X=a.data
    Y=a.target
    from sklearn.decomposition import PCA
    pca=PCA(n_components=0.95)
    pca.fit(X)
    X1=pca.transform(X)
    from sklearn.model_selection import train_test_split
    x_train,x_test,y_train,y_test=train_test_split(X1,Y,test_size=0.2,random_state=4)
    import sklearn.svm as svm
    from sklearn.svm import SVC
    clf = svm.SVC(kernel='linear') 
    clf.fit(x_train,y_train)
    rv=clf.score(x_train, y_train);
    y1=clf.predict(x_test)
    r=y1-y_test
    rs=len(r[r==0])/len(y1)
    
    return (rv,rs)

#********** End **********#