主成分分析

数据降维的方法,把多个变量的信息压缩成几个综合的变量,提取处有效的主成分。

PRINCOMP过程

格式:

proc princomp data=数据集名;
by variables; *指定分组变量;
var variables; *指定数据集中需要进行分析的变量名;

下表为20名学生的期中考试的五门课的成绩,试通过主成分分析提取一个综合指标,用以反映每名学生的综合学习情况。

代码:

data grade; /*建立主成分分析数据集*/
input xuehao g1-g5; /*定义输入变量*/
label xuehao='学号' g1='数学' g2='语文' g3='英语' g4='物理' g5='化学'; /*定义数据标签*/
cards; /*开始输入数据*/
     1    74    89    86    92    67
     2    81    76    68    84    79
     3    70    98    70    88    76
     4    83    62    85    63    78
     5    61    82    81    76    84
     6    82    71    62    75    62
     7    88    94    63    66    72
     8    98    73    70    93    84
     9    90    87    76    93    67
    10    89    62    78    78    84
    11    77    74    96    98    69
    12    85    79    83    65    83
    13    92    77    73    94    80
    14    63    82    79    90    78
    15    97    84    83    77    81
    16    96    64    66    84    97
    17    84    95    93    98    73
    18    70    90    98    85    76
    19    94    91    83    69    72
    20    80    92    61    74    76
;
proc princomp data=grade out=graderesult; /*主成分分析过程*/
var g1-g5; /*定义进行主成分分析的变量*/
run;

结果:
以下为一些简单的统计信息:

下图为相关矩阵以及相关矩阵的特征值,可以看到第三个特征值的累积贡献率已经达到75%:

下图为根据特征值计算得到的特征向量,相应的为第一二三四五主成分,可知各主成分与变量间的系数,只需提取前三个主成分,即可较好地反映学生的综合学习情况:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值