PCA降维算法
从高维度变为低维度的过程就是降维
例如拍照就是把处在三维空间中的人或物从转换到作为二维平面的照片中
降维有线性的、也有非线性的方法。在机器学习中可以简化运算,减少特征量
PCA算法是一种常用的线性降维算法,算法类似于“投影”
降维简化了数据集,故可以视为一个压缩过程,在压缩过程中可能会有信息丢失
PCA除可以用来精简特征,还可以应用在图像处理中,例如基于PCA算法的特征脸法,它可以用来人脸识别
PCA是基于K-L变换实现的一种算法
PCA算法在实现上用到了协方差矩阵,以及矩阵的特征分解
基本主要内容在于求出协方差矩阵,然后求协方差矩阵的特征值与特征向量
求出协方差矩阵C的特征值与特征向量 (SVD分解)
将特征向量按照特征值的大小从上至下依次排列,取前k行,作为矩阵P
求出P与X矩阵叉乘的结果,即为降维值k维的m条数据
案列
读取数据
数据集
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
4.6,3.1,1.5,0.2,Iris-setosa
5.0,3.6,1.4,0.2,Iris-setosa
5.4,3.9,1.7,0.4,Iris-setosa
4.6,3.4,1.4,0.3,Iris-setosa
5.0,3.4,1.5,0.2,Iris-setosa
4.4,2.9,1.4,0.2,Iris-setosa
4.9,3.1,1.5,0.1,Iris-setosa
5.4,3.7,1.5,0.2,Iris-setosa
4.8,3.4,1.6,0.2,Iris-setosa
4.8,3.0,1.4,0.1,Iris-setosa
4.3,3.0,1.1,0.1,Iris-setosa
5.8,4.0,1.2,0.2,Iris-setosa
5.7,4.4,1.5,0.4,Iris-setosa
5.4,3.9,1.3,0.4,Iris-setosa
5.1,3.5,1.4,0.3,Iris-setosa
5.7,3.8,1.7,0.3,Iris-setosa
5.1,3.8,1.5,0.3,Iris-setosa
5.4,3.4,1.7,0.2,Iris-setosa
5.1,3.7,1.5,0.4,Iris-setosa
4.6,3.6,1.0,0.2,Iris-setosa
5.1,3.3,1.7,0.5,Iris-setosa
4.8,3.4,1.9,0.2,Iris-setosa
5.0,3.0,1.6,0.2,Iris-setosa
5.0,3.4,1.6,0.4,Iris-setosa
5.2,3.5,1.5,0.2,Iris-setosa
5.2,3.4,1.4,0.2,Iris-setosa
4.7,3.2,1.6,0.2,Iris-setosa