机器学习案例:利用主成分分析为人脸数据降维——基于Scikit-Learn

《Python数据科学手册》笔记

该案例用的数据集为Scikit-Learn中的Wild数据集。

首先将人脸数据中前几个主成分的图像进行可视化,然后再看看这些成分的累计方差,最后根据累计方差图选择合适的主成分对人脸数据进行低维重构,观察效果。

一、特征脸

from sklearn.datasets import fetch_lfw_people
faces = fetch_lfw_people(min_faces_per_person=60)
from sklearn.decomposition import PCA
pca = PCA(150)
pca.fit(faces.data)
fig,axes = plt.subplots(3,8,figsize=(9,4),subplot_kw={'xticks':[],'yticks':[]},gridspec_kw=dict(hspace=0.1,wspace=0.1))
for i,ax in enumerate(axes.flat):
    ax.imshow(pca.components_[i].reshape(62,47),cmap='bone')

看上去有些恐怖(o(╥﹏╥)o) 

前面几张特征脸看起来和照向脸的光线角度有关,而后面的主向量挑选了特定的特征,例如眼睛、鼻子和嘴唇。

二、累计方差图

plt.plot(np.cumsum(pca.explained_variance_ratio_))
plt.xlabel('number of components')
plt.ylabel('cumulative explained variance')

可以看到,这150个成分包含了90%的方差,因此可以猜测,利用这150个成分能够重构图像。 

三、低维重构

pca = PCA(150).fit(faces.data)
components = pca.transform(faces.data)
projected = pca.inverse_transform(components)

fig,ax = plt.subplots(2,10,figsize=(10,2.5),subplot_kw={'xticks':[],'yticks':[]},gridspec_kw=dict(hspace=0.1,wspace=0.1))
for i in range(10):
    ax[0,i].imshow(faces.data[i].reshape(62,47),cmap='binary_r')
    ax[1,i].imshow(projected[i].reshape(62,47),cmap='binary_r')
    
ax[0,0].set_ylabel('full-dim\nimput')
ax[1,0].set_ylabel('150-dim\nreconstruction')

第一行为原始图片,第二行为重构后的图片。原始数据将近3000维,而这里只用了150维进行数据重构,比较两行图片,肉眼看来相差并不大,说明在主成分分析法降维之后,后续的分类算法只需要在150维的数据上训练,而不需要在3000维的数据上训练,节约了很多时间与空间。

 

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值