【R统计】主成分分析1

习题:

9.1用主成分方法探讨城市工业主体结构。下表是某事工业部门十三个行业,分别是冶金(1)、电力(2)、煤炭(3)、化学(4)、机械(5)、建材(6)、森工(7)、食品(8)、纺织(9)、缝纫(10),皮革(11)、造纸(12)和文教艺术用品(13),八个指标分别是年末固定资产净值X1(万元)、职工人数X2(人)、工业总产值X3(万元)、全员劳动生产率X4(元/人年)、百元固定元值实现产值X5(元)、资金利率X6(%)、标准燃料消费量X7(吨)和能源利用效果X8(万元/吨)的数据。

(1)试用主成分分析方法确定8个指标的几个主成分,并对主成分进行解释;

(2)利用主成分得分对13个行业进行排序和分类。

原始数据(data.txt):

	X1	X2	X3	X4	X5	X6	X7	X8
1	90342	52455	101091	19272	82.0	16.1	197435	0.172
2	4903	1973	2035	10313	34.2	7.1	592077	0.003
3	6735	21139	3767	1780	36.1	8.2	726396	0.003
4	49454	36241	81557	22504	98.1	25.9	348226	0.985
5	139190	203505	215898	10609	93.2	12.6	139572	0.628
6	12215	16219	10351	6382	62.5	8.7	145818	0.066
7	2372	6572	8103	12329	184.4	22.2	20921	0.152
8	11062	23078	54935	23804	370.4	41.0	65486	0.263
9	17111	23907	52108	21796	221.5	21.5	63806	0.276
10	1206	3930	6126	15586	330.4	29.5	1840	0.437
11	2150	5704	6200	10870	184.2	12.0	8913	0.274
12	5251	6155	10383	16875	146.4	27.5	78796	0.151
13	14341	13203	19396	14691	94.6	17.8	6354	1.574

  

脚本

#p269 9.1
#p220

#读取数据
hangye<-read.table("data.txt");

#### 作主成分分析,并显示结果
hangye.pr<-princomp(hangye, cor=TRUE)
summary(hangye.pr, loadings=TRUE)
###输出
# Importance of components:
                          # Comp.1    Comp.2    Comp.3     Comp.4     Comp.5
# Standard deviation     1.7620762 1.7021873 0.9644768 0.80132532 0.55143824
# Proportion of Variance 0.3881141 0.3621802 0.1162769 0.08026528 0.03801052
# Cumulative Proportion  0.3881141 0.7502943 0.8665712 0.94683649 0.98484701
                           # Comp.6      Comp.7       Comp.8
# Standard deviation     0.29427497 0.179400062 0.0494143207
# Proportion of Variance 0.01082472 0.004023048 0.0003052219
# Cumulative Proportion  0.99567173 0.999694778 1.0000000000

# Loadings:
   # Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 Comp.8
# X1  0.477 -0.296 -0.104         0.184         0.758  0.245
# X2  0.473 -0.278 -0.163 -0.174 -0.305        -0.518  0.527
# X3  0.424 -0.378 -0.156                      -0.174 -0.781
# X4 -0.213 -0.451         0.516  0.539  0.288 -0.249  0.220
# X5 -0.388 -0.331 -0.321 -0.199 -0.450  0.582  0.233       
# X6 -0.352 -0.403 -0.145  0.279 -0.317 -0.714              
# X7  0.215  0.377 -0.140  0.758 -0.418  0.194              
# X8        -0.273  0.891        -0.322  0.122              
###解释
#前两个主成分解释了75%的差异
#Comp.1 反映的是“高固定资产、高职工人数、高工业产值、低全员生产率、低资金利率、低标准燃料消费”,看做规模因子
#Comp.2 反映的是“高标准燃料消费、低全员劳动生产率、低资金利税率”,看做燃料因子
#Comp.3 反映的是“高能源利用效果”,看做能源利用率因子


#### 作预测
predict(hangye.pr)

#### 作图,分类和排序
biplot(hangye.pr)

  

图片

解答:

(1)见脚本注释。

(2)见上图。可按前两轴排序。3 2 6可分为一组,属于能源消耗类重工业;11 7 12分为一组,为资源消耗类轻工业;1 4为化学工业;9 10 13为劳动力密集型制造业; 8 为食品业。

 

博文源代码和习题均来自于教材《统计建模与R软件》(ISBN:9787302143666,作者:薛毅)。

转载于:https://www.cnblogs.com/liulele/p/9074131.html

  • 1
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要在R语言中进行主成分分析,可以使用stats包中的prcomp()函数。下面是一个简单的例子: 假设有一个数据集data,其中包含了10个变量,可以按照以下方式进行主成分分析: ```R # 加载数据 data <- read.csv("data.csv") # 主成分分析 pca <- prcomp(data, scale = TRUE) # 输出结果 summary(pca) ``` 这里,prcomp()函数的第一个参数是数据集,第二个参数scale=TRUE表示对数据进行标准化处理,以避免变量之间的尺度差异影响分析结果。summary(pca)函数可以输出主成分分析的结果,包括每个主成分的解释方差比例、成分载荷矩阵等信息。 ### 回答2: R语言是一种强大的统计分析工具,可以用于进行主成分分析(PCA)。主成分分析是一种常用的数据降维方法,可以将高维数据降低到低维空间中。在R语言中,可以使用princomp函数进行主成分分析。 首先,需要加载princomp函数的包。可以使用以下命令加载: `library(stats)` 接下来,需要准备好需要进行主成分分析的数据。假设我们有一个名为data的数据集,包含了多个自变量。可以使用以下命令创建data对象: `data <- data.frame(x1, x2, x3)` 其中x1、x2、x3是数据集中的自变量。如果数据集已经存在于R环境中,可以直接使用数据集的名称。 然后,可以使用princomp函数进行主成分分析。以下是一个示例命令: `pca <- princomp(data, cor = TRUE)` 这里的cor = TRUE表示计算变量之间的相关系数矩阵。如果数据集已经是标准化的,则可以使用cor = FALSE。 主成分分析的结果存储在pca对象中。可以使用summary函数查看主成分分析的结果摘要: `summary(pca)` 该函数会给出各个主成分的方差解释比例、特征值以及主成分得分的摘要信息。 此外,还可以使用biplot函数绘制主成分分析的双变量图。示例如下: `biplot(pca)` 该函数会绘制主成分得分的双变量图,并在图上显示自变量和主成分的关系。 通过以上步骤,我们可以在R语言中使用princomp函数进行主成分分析。这个过程有助于我们理解数据集的结构以及自变量之间的关系,并可以通过降维来简化数据集的分析和可视化。 ### 回答3: R语言是一种用于统计分析和数据可视化的编程语言,主成分分析(PCA)是一种常用的无监督学习方法,用于降维和数据可视化。 在R语言中,我们可以使用函数`prcomp()`来进行主成分分析。以下是使用R语言进行主成分分析的基本步骤: 1. 准备数据:首先,需要准备一个数据集,其中包含要进行主成分分析的变量。数据应该是数值型的,并且可以包含缺失值。 2. 标准化数据:使用`scale()`函数对数据进行标准化,将数据的均值减去,并将数据缩放到单位方差。这是因为主成分分析是基于数据的协方差矩阵。 3. 执行主成分分析:使用`prcomp()`函数执行主成分分析。将标准化的数据作为输入,并设置其他参数,如是否计算和保存主成分得分。 4. 结果解释:主成分分析得到一组主成分(也称为主成分向量或加载向量),它们是原始变量的线性组合。通过查看主成分的方差贡献,可以确定哪些主成分解释了大部分的变异性。还可以通过画出散点图矩阵或绘制主成分得分的散点图来进行数据的可视化和解释。 5. 结果应用:主成分分析的结果可用于降维,可以选择保留少数主成分,以保留最重要的信息,并减少数据的维数。此外,主成分分析还可用于发现数据之间的模式和关系,以及用于数据预处理和异常值检测。 总之,R语言提供了强大的主成分分析函数`prcomp()`,使用户能够进行数据降维和可视化、数据模式发现以及统计分析等任务。通过掌握主成分分析的基本步骤和R语言的语法,可以轻松地进行主成分分析和相关的统计分析工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值