目录
一、主成分分析的介绍
主成分分析是一种
降维算法
,它能将多个指标转换为少数几个主成分,这些主成分是原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。
而降维有什么作用呢?
1.使得数据集更易使用;
2.降低算法的计算开销;
3.去除噪声;
4.使得结果容易理解。
二、主成分分析计算步骤
假设有n个样本,p个指标,则有n*p的样本矩阵x:
1. 先对样本矩阵 x 进行标准化处理:
2.在计算标准化矩阵 X 的协方差矩阵:
3.计算 R 的特征值和特征向量
特征值 的计算公式:
其中 R 是协方差矩阵,又叫相关系数矩阵,E 为单位矩阵。
matlab计算特征值和特征向量 用eig 。
其中,V 是特征向量矩阵,D 是特征值构成的对角矩阵(注意 D 特征值是从小到大的)。
如果你想详细了解eig,可以点击下面matlab官方文件对eig的介绍。
4.主成分贡献率以及累计贡献率
5.写出主成分
一般取累积贡献率超过80%的前m项主成分。
本文是学习----数学建模学习交流---主成分分析视频的学习笔记