![fefa2d80a5614ead98c8dc5463477c0d.png](https://i-blog.csdnimg.cn/blog_migrate/49cf01979bc4e06f16a04db2817be5e1.jpeg)
![41760472b8c4e7e5982a0dbc0d823e70.png](https://i-blog.csdnimg.cn/blog_migrate/0144244ee40b1095e8cc8c55b3a69188.jpeg)
相亲可能是大家经历过或者即将经历的一大人生阶段,要论其中门道可是林林总总,稀奇古怪也属屡见不鲜。就拿其中的征婚条件而言,“硬通货”的房、车、存款、工作、品格, “软条件”的相貌、身材、学历等五花八门,在诸多相亲对象里,若有一位俱是上佳,那直接领走便是。但若是有长有短,可就让人难以度量决断了。这时候如果我们能够将众多指标汇总,通过某种方式得出一个综合指标,用这个指标在一定程度上代替原来的各种征婚条件,这样就可以将相亲对象一一排序,择优录取了。
在现实中,很多问题往往涉及多个变量,并且某些变量之间会有一定的相关性,为了简化分析过程和提高准确性,我们希望构造几个互不相关的新指标来代替原始变量,同时尽可能减少这一过程的信息损失。主成分分析正是这样一个化繁为简的过程,其目的主要包括三个方面,一是减少决策变量数,也就是降维;二是用少数几个综合指标代表大部分信息;三是防范多重共线性,即防止变量间相关性较强使得模型估计失真。
主成分分析的步骤
(1)原始数据标准化
(2)计算标准化变量间的相关系数矩阵
(3)计算相关系数矩阵的特征值和特征向量
(4)计算主成分变量值
(5)统计结果分析,提取所需的主成分
本期“品玩SAS”以主成分分析为题,结合全国十省市2017年经济发展基本情况的八项指标,完整体验SAS主成分分析的过程。
变量说明&