R-因子分析的应用

 

摘要

了解各个地区的教育水平对提升国民素质及建设美好社会主义中国有着极大的作用。本文对中国各省市就业人员受教育水平进行研究,使用了2015年全国31个省份的就业人员受教育程度的数据,运用因子分析方法对影响其教育水平的因素进行分析,选取了3个主要因子,并合理解释了全国各个地区就业人员受教育水平在各个因子上的得分,给出了全国各个省份就业人员受教育水平的综合评价,愿为因子分析法在实际生活中的应用提供依据。

关键词:就业人员受教育水平、因子分析法

Abstract

Understanding the educationallevel of various regions plays a great role in improving the quality of thepeople and building a better socialist China. This paper studies theeducational level of the employment personnel in various provinces and citiesin China, uses the data of the educational level of the workers in 31 provincesin 2015, analyzes the factors affecting their educational level by means offactor analysis, selects 3 main factors, and understands the education of theemployment personnel in all regions of the country. The score of the level oneach factor gives the comprehensive evaluation of the educational level of theemployment personnel in all provinces of the country, and is willing to providethe basis for the application of factor analysis in the actual life.

Keywords:Theeducational level and factor analysis method of the employment personnel



现如今,随着经济多元化的不断发展,各层岗位所需要的人才也不断的多元化,各省份就业人员的文化水平参差不齐。为了更好的了解各省份就业人员整体文化水平,本文以2015年劳动力调查资料中各省份就业人员文化水平所占比例的数据为例,使用因子分析法对各省份从业人员文化水平进行了综合分析,得出了北京、上海、天津、江苏、广东地区的就业人员文化程度普遍高于其他地区。

二、          因子分析简介

2.1 基本思想:

因子分析同主成分分析一样,它也是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。其基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,不同组的变量间相关性则较低。

因子分析不仅可以帮助我们对复杂的经济问题进行分析和解释,还可用于对变量或样品进行分类处理。本文以R型因子分析(即研究变量间的相关关系)出发,对所给出的问题进行分析、解释及分类。

2.2 模型理论:

假设由n个样品,每个样品观测值p个指标,这p个指标之间具有较强的相关性。为了便于研究,对样本观测数据进行标准化处理。使标准化后的变量均值为0,方差为1。为方便,将原始变量及标准化变量均用向量X表示,用表示标准化的公共因子(F为隐变量,不可观测,且均值为0,协方阵为单位阵),此外,还假设是相互独立的。则有以下模型:

 

矩阵可表示为  

其中,                 

2.3因子分析基本步骤

⑴根据研究问题选取原始变量;

⑵对原变量进行标准化并求其相关阵,分析变量之间的相关性;

⑶求解初始公共因子及因子载荷矩阵(如主成分法、主轴因子法、极大似然法等);

⑷因子旋转(必要的时候可进行);

⑸计算因子得分;

⑹根据因子得分值进一步分析。

三、          案例分析

下面是全国31个省份的就业人员受教育程度(百分比)统计,即一百个就业人员中,各种学历的人员所占的比例,数据来源于2015年劳动力调查资料,为了操作方便,我们对数据做了一些处理,删除了一些指标。我们的目的是利用因子分析把31个省份归类,看看哪些省份的就业人员有着相似比率的受教育程度。方便我们更好选择就业城市。

 

 

 

3.1 数据及指标解释

地区

x1

x2

x3

x4

x5

x6

x7

x8

x9

北京

0.2

3

21.5

13.6

7.3

1.9

19.8

26.8

6.1

天津

0.5

8.4

33.5

12.1

9.8

1.3

14.8

17.3

2.3

河北

1.3

13.6

49.4

13.6

5.2

1.1

9.2

6

0.5

山西

1.3

11.6

47.5

13

4.9

0.9

10.9

9.1

0.8

内蒙古

2.4

17.7

45.2

12.5

3.4

0.8

10.2

7.6

0.3

辽宁

0.5

12.7

50.3

10.1

5.1

1.4

9.8

9.3

0.9

本文数据来源于《中国统计年鉴2015》,上述只展示了经处理的前几行数据,具体原数据详见附录。其中,

X1——为上过学;          x2——小学;

X3——初中;              x4——高中;

X5——中等职业教育;        x6——高等职业教育;

X7——大学专科;          x8——大学本科;

X9——研究生.

3.2计算运行结果

3.2.1 读入数据

> mydata <- read.csv(file.choose('education.csv'))
> attach(mydata)
> head(mydata)  

 

 

  地区  x1   x2   x3   x4  x5  x6   x7   x8  x9
1   北京 0.2  3.0 21.5 13.6 7.3 1.9 19.8 26.8 6.1
2   天津 0.5  8.4 33.5 12.1 9.8 1.3 14.8 17.3 2.3
3   河北 1.3 13.6 49.4 13.6 5.2 1.1  9.2  6.0 0.5
4   山西 1.3 11.6 47.5 13.0 4.9 0.9 10.9  9.1 0.8
5 内蒙古 2.4 17.7 45.2 12.5 3.4 0.8 10.2  7.6 0.3
6   辽宁 0.5 12.7 50.3 10.1 5.1 1.4  9.8  9.3 0.9
#计算相关阵
>r <- cor(scale(mydata[,-1])); r

 

  x1         x2          x3         x4          x5         x6
  • 13
    点赞
  • 145
    收藏
    觉得还不错? 一键收藏
  • 13
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值