数学建模算法打卡2
§ 主成分分析
1 基本思想及方法
主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分。其中Li为p维正交化向量(Li*Li=1),Zi之间互不相关且按照方差由大到小排列,则称Zi为X的第I个主成分。设X的协方差矩阵为Σ,则Σ必为半正定对称矩阵,求特征值λi(按从大到小排序)及其特征向量,可以证明,λi所对应的正交化特征向量,即为第I个主成分Zi所对应的系数向量Li,而Zi的方差贡献率定义为λi/Σλj,通常要求提取的主成分的数量k满足Σλk/Σλj>0.85。
2.分析步骤
数据标准化;
求相关系数矩阵;
主成分分析法步骤
一系列正交变换,使非对角线上的数置0,加到主对角上,得特征根系(即相应那个主成分引起变异的方差),并按照从大到小的顺序把特征根排列;求各个特征根对应的特征向量;
用下式计算每个特征根的贡献率Vi;
Vi=xi/(x1+x2+…)
根据特征根及其特征向量解释主成分物理意义。
3.主成分估计
主成分估计采用的方法是将原来的回归自变量变换到另一组变量,即主成分,选择其中一部分重要的主成分作为新的自变量(此时丢弃了一部分影响不大的自变量,这实际达到了降维的目的),然后用最小二乘法对选取主成分后的模型参数进行估计,最后再变换回原来的模型求出参数的估计。
4.基于主成分分析法的综合评价
定性考察反映高等教育发展状况的五个方面