1.数据预处理:均值中心化,方差归一化
2.计算各变量协方差矩阵
3:计算特征值,特征向量
4:将特征值从大到小排序,选前k大的,其对应的特征向量组成线性变换矩阵。
5:将原数据以特征变换矩阵进行线性变换,得到k维数据
k值选择:累积贡献率大于80%或者特征值大于1
累计贡献率:选作主成分的方差和与所有成分方差和的比值
理论基础:方差最大化,均方误差最小化
1.数据预处理:均值中心化,方差归一化
2.计算各变量协方差矩阵
3:计算特征值,特征向量
4:将特征值从大到小排序,选前k大的,其对应的特征向量组成线性变换矩阵。
5:将原数据以特征变换矩阵进行线性变换,得到k维数据
k值选择:累积贡献率大于80%或者特征值大于1
累计贡献率:选作主成分的方差和与所有成分方差和的比值
理论基础:方差最大化,均方误差最小化