主成分分析法

一、概述

1.定义

主成分分析(Principal Component Analysis,PCA),将多个变量通过线性变换以选出较少个数重要变量的一种

多元统计分析方法。

2.背景

一项十分著名的工作是美国的统计学家斯通(stone)在 1947年关于国民经济的研究。他曾利用美国1929一1938 年各年的数据,得到了17个反映国民收入与支出的变量 要素,例如雇主补贴、消费资料和生产资料、纯公共支 出、净增库存、股息、利息外贸平衡等等。 在进行主成分分析后,竟以97.4%的精度,用三新变量 就取代了原17个变量。根据经济学知识,斯通给这三个 新变量分别命名为总收入F1、总收入变化率F2和经济发 展或衰退的趋势F3。

3.主成分与原始变量之间的关系

(1)主成分保留了原始变量绝大多数信息。

(2)主成分的个数大大少于原始变量的数目。

(3)各个主成分之间互不相关

(4)每个主成分都是原始变量的线性组合

4.深入理解

假设原始数据有n个指标,把n个指标看作X1,X2....Xn n个随机数,我们对p个指标进行线性组合,组合生成的远小于n个新指标,保留主要信息量反应原指标信息,并且相互独立。在数学上这个过程我们叫做降维。

二、操作实例(使用spss软件)

1.导入数据

2.分析-->降维-->因子分析-->所有因子都导入到变量中-->表述(勾选系数)-->抽取(勾选碎石图片)-->得分(显示因子得分系数矩阵)-->点击确定

3.数据结果分析(用体表数据说话)

相关性矩阵
GDP人均GDP农业增加值工业增加值第三产业增加值
相关性GDP1.000-.094-.052.967.979
人均GDP-.0941.000-.171.113.074
农业增加值-.052-.1711.000-.132-.050
工业增加值.967.113-.1321.000.985
第三产业增加值.979.074-.050.9851.000
固定资产投资.923.214-.098.963.973
基本建设投资.922.093-.176.939.940
社会消费品零售总额.941-.043.013.935.962
海关出口总额.637.081-.125.705.714
地方财政收入.826.273-.086.898.913
 
相关性矩阵
固定资产投资基本建设投资社会消费品零售总额海关出口总额
相关性GDP.923.922.941.637
人均GDP.214.093-.043.081
农业增加值-.098-.176.013-.125
工业增加值.963.939.935.705
第三产业增加值.973.940.962.714
固定资产投资1.000.971.937.717
基本建设投资.9711.000.897.624
社会消费品零售总额.937.8971.000.836
海关出口总额.717.624.8361.000
地方财政收入.934.848.929.882
相关性矩阵
地方财政收入
相关性GDP.826
人均GDP.273
农业增加值-.086
工业增加值.898
第三产业增加值.913
固定资产投资.934
基本建设投资.848
社会消费品零售总额.929
海关出口总额.882
地方财政收入1.000
 
总方差解释
成分初始特征值提取载荷平方和
总计方差百分比累积 %总计方差百分比累积 %
17.22072.20572.2057.22072.20572.205
21.23512.34684.5511.23512.34684.551
3.8778.76993.319
4.5475.46698.786
5.085.85499.640
6.021.21199.850
7.012.11999.970
8.002.01899.988
9.001.012100.000
10-1.098E-16-1.098E-15100.000
数据显示可以知道1和2就已经占到了总方差的4.551%,小于1的属性不再考虑

 

原理理解

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值