应用统计学第14周作业(主成分分析PCA、SPSS)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2.

在这里插入图片描述

通过总方差解释表,可以看出如果将原数据空间降为2维,保留的信息精度是81.42%。

在这里插入图片描述
在这里插入图片描述
所有变量都和成分1关系比较大而和成分2关系不大,可以考虑降成1维。

在这里插入图片描述
在这里插入图片描述
在2维情况下聚类之后画散点图效果比较一般,因为二维数据还是显示出比较强的线性相关性,最后还是化成1维。

在这里插入图片描述
对观测值进行聚类会明显地发现空气污染存在明显的地区差异。以北京、上海为代表的大城市产业以第三产业为主,第一、二产业外移而各项空气指标好,以西藏、青海为代表的地区因为工业不发达同样有很好的空气指标。
但与之相反的以河北、山西为代表的重工业发展地区空气指标很差。
除此之外的其他地区也是各有特点。
在这里插入图片描述
对变量进行聚类可以看出气体和粉尘的排放量显然是相关关系比较明显的几个自变量,而生铁、玻璃、焦炭等的产量是有较大相关关系的的自变量。

3.

在这里插入图片描述
将自变量降成2维,总方差解释率可以达到92.31%,将原来的8个变量降成2个变量,所以降维的效果还是很明显的。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
从成分矩阵和组件图中可以分析出的是组件2与劳动生产率关系密切而与其他因素关系都比较小,所以第二主成分可以用劳动生产率来代表,其他自变量高度与第一主成分相关,可以用企业规模来代表。

在这里插入图片描述
对观测值进行聚类,1、2企业规模相当大,所以聚类结果中出现他们聚为一类,3、4、6、8的企业规模次之,低于1、2但是总产值可以达到三位数,所以也被聚为一类,之后其他的可以看做是规模比较小的一类。
在这里插入图片描述
对变量进行聚类可以发现,劳动生产率的指标和其他指标的关系比较小,这一点和主成分分析PCA的结果不谋而合,所以对变量进行聚类和PCA似乎也有几分关系。

在其他指标中,职工人数与另几个指标的关系也略微小一点,因为职工人数和纺织工业的产能当然有关系,但是可能和机器等技术因素关系更大一些。

4.
(1)

第一主成分: y 1 = 0.3428 x 1 + 0.4525 x 2 + 0.3965 x 3 + 0.5499 x 4 + 0.4667 x 5 y_1 = 0.3428x_1+0.4525x_2+0.3965x_3+0.5499x_4+0.4667x_5 y1=0.3428x1+0.4525x2+0.3965x3+0.5499x4+0.4667x5
第二主成分: y 2 = 0.6013 x 1 − 0.4066 x 2 + 0.5416 x 3 − 0.0776 x 4 − 0.4123 x 5 y_2 = 0.6013x_1-0.4066x_2+0.5416x_3-0.0776x_4-0.4123x_5 y2=0.6013x10.4066x2+0.5416x30.0776x40.4123x5

(2)

累计贡献率 = (2.873+1.797)/6 = 0.7783 = 77.83%

(3)

r ( y 1 , x 1 ) = λ 1 u 11 = 2.873 × 0.3428 = 0.5797 r(y1,x1) = \sqrt\lambda_1u_{11} = \sqrt{2.873}\times0.3428 = 0.5797 r(y1,x1)=λ 1u11=2.873 ×0.3428=0.5797

(4)

X2-教育程度、X5-中等房价和X4-服务业人数与第一主成分高度相关,可以衡量该地区的现代化程度,所以第一主成分可以用现代化程度代表。
X1-人口总数、X3-就业人数主要和人口有关系,所以用人口量来表示第二主成分。

(5)

9、10属于人口量大,现代化程度也高;6、8、11、12属于人口量大,但是现代化程度较低;1、4、5属于人口量小,但是现代化程度高;2、3、7属于人口量小,现代化程度也低。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cachel wood

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值