Principal Component Analysis
主成分分析
非监督学习算法
作用主要用于数据降维
通过降维,可以发现更便于人类理解的特征
也可以进行:可视化,去燥
二维平面特征1和特征2
我们怎么降到1维?
我们两个特征选一个吧另一个给扔了就可以了
同理对于y也一样
我们已经有了两张降维方案
哪个方案是更好的降维方案?
右边的更好,点和点之间的距离更大,拥有更高的可区分度
同时他们的距离比较大也更好的保持了原来的点和点的距离
我们选择的话我们显然选择右侧
我们也可以映射到这个直线上