机器学习笔记第五章
主成分分析(Principal Component Analysis)
- 一个非监督的机器学习算法
- 主要用于数据的降维
- 通过降维,可以发现更便于人类理解的特征
- 其他应用:可视化;去噪
找到让样本间间距最大的轴的步骤:
-
将样例的均值归为0 (demean 的过程) ,所有样本都减去这批样本的均值,相当于移动坐标轴
-
求一个轴的方向 w = ( w1, w2)
-
所有样本映射到w之后,有:
因为X的均值为0,所以:
主成分分析法:
梯度上升法解决主成分分析问题
求数据的主成分(PCA)
PCA不仅是降维的,还能降噪
人脸识别与特征脸
特征脸:提取完特征的脸的图像
主要是学习sklearn当中的fetch_flw_people这个函数、以及plot_faces这个函数