yugao1986的专栏

SAS and R 学习记录

因子分析过程

http://blog.renren.com/blog/220869953/729589635?from=fanyeNew 

Factor因子分析过程

因子分析用少数起根本作用、相互独立、易于解释通常又是不可观察的因子来概括和描述数据,表达一组相互关联的变量。通常情况下,这些相关因素并不能直观观测,这类分析通常需用因子分析完成。

 factor过程一般由下列语句控制: 

proc factor  data=数据集 <选项列表> ;

priors   公因子方差 ;

var      变量表 ;

partial  变量表 ;

freq     变量 ;

weight   变量 ;

by       变量 ;

run ;

 

1.       proc factor语句的<选项列表>。

1)         有关输出数据集选项。

l       out= 输出数据集——创建一个输出数据集,包括输入数据集中的全部数据和因子得分估计。

l       outstat= 输出数据集——用于存储因子分析的结果。这个结果中的部分内容可作为进一步因子分析的读入数据集。

2)         有关因子提取和公因子方差选项。

l       method= 因子选择方法——包括principal(主成份法),prinit(迭代主因子法),usl(没有加权的最小二乘因子法),alpha( 因子法或称harris法),ml(极大似然法),image(映象协方差阵的主成份法),pattern(从type=选项的数据集中读入因子模型)、score(从type=选项的数据集中读入得分系数)。常用方法为principal(主成份法)、ml(极大似然法)和prinit(迭代主因子法)。

l       heywood——公因子方差大于1时令其为1,并允许迭代继续执行下去。因为公因子方差是相关系数的平方,我们要求它总是在0和1之间。这是公因子模型的数学性质决定的。尽管如此,但在最终的公因子方差的迭代估计时有可能超过1。如果公因子方差等于1,这种状况称为Heywood状况,如果公因子方差大于1,这种状况称为超-Heywood状况。在超-Heywood状况时,因子解是无效的。

l       priors =公因子方差的计算方法名——规定计算先验公因子方差估计的方法,即给各变量的公因子方差 赋初值,包括one(等于1.0),max (最大绝对相关系数 ),smc(多元相关系数的平方),asmc (与多元相关系数的平方成比例,但要适当调整使它们的和等于最大绝对相关),input (从data=指定的数据集中,按type=指定类型读入第一个观察中的先验公因子方差估计),random(0与1之间的随机数)。

3)         有关规定因子个数及收敛准则的选项。

l       nfactors=n——要求保留n个公因子,否则只保留特征值大于1的那些公因子。

l       mineigen=p——规定被保留因子的最小特征值。

l       proportion=p——使用先验公因子方差估计,对被保留的因子规定所占公共方差比例为这个p值。

l       converge=p——当公因子方差的最大改变小于p时停止迭代。缺省值=0.001。

l       maxiter=n——规定迭代的最大数。缺省值为30。

4)         有关旋转方法的选项。

l       rotate=因子转轴方式名——给出旋转方法。包括none,varimax,quartimax,equamax,orthomax,hk,promax,procrustes。常用的有varimax(正交的最大方差转轴法)、orthomax(由gamma=指定权数的正交方差最大转轴法)和promax(在正交最大方差转轴的基础上进行斜交旋转)。

l       norm=kaiser | raw | weight | cov | none——为了对因子模型进行旋转,规定模型矩阵中行的正规化方法。例如,norm=kaiser表示使用Kaiser的正规化方法。norm=weight表示使用Cureton-Mulaik方法进行加权。norm=cov表示模型矩阵的这些行被重新标度为表示协方差而不是相关系数。norm=raw或none表示不进行正规化。

l       gamma=p——规定正交方差最大旋转的权数。

l       prerotate=因子转轴方式名——规定预先旋转的方法。除了promax和procrustes的旋转方法,任何其他的旋转方法都可使用。

5)         有关控制打印输出的选项。

l       simple——打印输出包括简单统计数。

l       corr——打印输出相关阵和偏相关阵。

l       score——打印因子得分模型中的系数。

l       scree——打印特征值的屏幕图。

l       ev——打印输出特征向量。

l       residuals——打印残差相关阵和有关的偏相关阵。

l       nplot=n——规定被作图的因子个数。

l       plot——在旋转之后画因子模型图。

l       preplot——在旋转之前画因子模型图。

l       msa——打印被所有其余变量控制的每对变量间的偏相关,并抽样适当的Kaiser度量。

l       reorder——在打印输出时让各种因子矩阵的这些行重新排序。在第一个因子上具有最大绝对载荷的变量首先被输出,然后按最大载荷到最小输出,紧接着在第二个因子上输出具有最大绝对载荷的变量等等。

2.       priors语句。

为var变量设定公因子方差,值在0.0和1.0之间。其值的设定应与var语句的变量相对应。例如:proc factor;priors  0.7  0.8  0.9; var  x  y  z;

其他语句的使用略。

 Factor score因子得分过程

无论是初始因子模型还是旋转后的因子模型,都是将指标表示为公因子的线性组合。在因子分析中,还可以将公因子表示为指标的线性组合,这样就可以从指标的观测值估计各个公因子的值,这种值叫因子得分。它对样品的分类有实际意义。因子得分可由proc score过程完成。

score过程一般由下列语句控制:  

proc score   data=数据集 <选项列表>  ;

var 变量 ;

run ;

 proc score语句选项包括out=输出数据集,存储因子得分结果等。将factor和score两个过程书写在同一个程序中,可以提高分析的效率。

实例分析

  下表36.1给出的数据是在洛杉矾十二个标准大都市居民统计地区中进行人口调查获得的。它有五个社会经济变量,它们分别是人口总数(pop) 、居民的教育程度或中等教育的年数(school )、雇佣人总数(employ )、各种服务行业的人数(services )和中等的房价(house ),试作因子分析。

表36.1  五个社会因素调查数据

编号

pop

school

employ

services

house

1

5700

12.8

2500

270

25000

2

1000

10.9

600

10

10000

3

3400

8.8

1000

10

9000

4

3800

13.6

1700

140

25000

5

4000

12.8

1600

140

25000

6

8200

8.3

2600

60

12000

7

1200

11.4

400

10

16000

8

9100

11.5

3300

60

14000

9

9900

12.5

3400

180

18000

10

9600

13.7

3600

390

25000

11

9600

9.6

3300

80

12000

12

9400

11.4

4000

100

13000

 

  1. 1.       建立数据文件。程序如下:

data socecon;

input   pop school employ services house;

title   'FIVE SOCIO-ECONOMIC VARIABLES';

cards;

          5700  12.8  2500  270  25000

          1000  10.9  600   10   10000

           …    …    …    …   …

          9400  11.4  4000  100  13000

;

run;

程序运行后,生成一个scoecon数据集。

  1. 2.       调用因子分析factor过程。

菜单操作方法,在SAS系统的主菜上,选择Globals/SAS/Assist 进入Assist的主菜单,再选择data analysis/multivar/factor analysis(因子分析)。编程方法如下:

proc factor data=socecon method=prin priors=one simple corr score;

run;

proc factor data=socecon method=prin priors=smc msa scree residual preplot

                         rotate=promax reorder plot outstat=fact_all ;

run;

proc factor data=socecon method=ml heywood nfacotors=1;

run;

proc factor data=socecon method=ml heywood nfactors=2;

run;

proc factor data=socecon method=ml heywood nfactors=3;

run;

程序说明:共调用了5个factor因子分析过程。第1个过程为主成份因子分析,第2个过程为主因子分析,第3个过程为提取一个因子的最大似然分析,第4个过程为提取二个因子的最大似然分析,第5个过程为提取三个因子的最大似然分析。

第1个factor因子分析过程,由于选项method=prin 和priors=one,提取因子的方法采用主成份分析,先验公因子方差估计被规定为1。选项simple和 corr要求输出描述统计量和相关阵。选项score要求输出因子得分系数。

第2个factor因子分析过程, 由于不是priors=one选项,所以提取因子的方法采用主因子分析,选项method=prin不起作用。选项priors=smc表示先验公因子方差估计被规定为每个变量与其他变量的多重相关系数的平方。选项msa表示控制所有其余变量的偏相关。选项scree表示输出所有特征值按从大到小排列的斜坡图,用于选择因子个数。选项residual输出残差相关阵和有关的偏相关阵,得到特殊因子方差的剩余相关。选项rotate=promax规定因子模型预先按正交最大方差的旋转,再在正交最大方差转轴的基础上进行斜交的promax旋转。选项preplot表示绘制因子模型旋转前的散点图。选项plot表示绘制因子模型旋转后的散点图。选项reorder表示按因子上具有的载荷大小排列。选项outstat=fact_all表示将因子分析的各种结果输出到fact_all数据集中。

其他3个最大似然因子分析过程的说明,我们在这里省略。第1和第2个factor因子分析过程运行后,主要的结果见表36.2到表36.9。

表 36.2  均值、标准差及相关矩阵

Means and Standard Deviations from 12 observations(每个变量的均值和标准差)

POP       SCHOOL      EMPLOY    SERVICES       HOUSE

Mean      6241.66667  11.4416667  2333.33333  120.833333       17000

Std Dev   3439.99427  1.78654483  1241.21153  114.927513  6367.53128

Correlations(相关矩阵)

              POP       SCHOOL     EMPLOY   SERVICES   HOUSE

POP        1.00000   0.00975   0.97245   0.43887   0.02241

SCHOOL     0.00975   1.00000   0.15428   0.69141   0.86307

EMPLOY     0.97245   0.15428   1.00000   0.51472   0.12193

SERVICES   0.43887   0.69141   0.51472   1.00000   0.77765

HOUSE      0.02241   0.86307   0.12193   0.77765   1.00000

 

表 36.3   主成份法的输出结果

Initial Factor Method: Principal Components

Prior Communality Estimates: ONE(初始公因子方差估计值)

Eigenvalues of the Correlation Matrix:  Total = 5  Average = 1

(相关矩阵的特征值)

                            1           2             3                 4             5

Eigenvalue        2.8733      1.7967      0.2148      0.0999      0.0153

Difference        1.0767      1.5818      0.1149      0.0847

Proportion        0.5747      0.3593      0.0430      0.0200      0.0031

Cumulative        0.5747      0.9340      0.9770      0.9969      1.0000

2 factors will be retained by the MINEIGEN criterion.(确定的因子数目)

Factor Pattern(因子模型)

           FACTOR1   FACTOR2

POP        0.58096   0.80642

SCHOOL     0.76704  -0.54476

EMPLOY     0.67243   0.72605

SERVICES   0.93239  -0.10431

HOUSE      0.79116  -0.55818

Variance explained by each factor(每个因子解释的方差)

FACTOR1   FACTOR2

2.873314  1.796660

Final Communality Estimates: Total = 4.669974(最终公因子方差估计)

      POP    SCHOOL    EMPLOY  SERVICES     HOUSE

0.987826  0.885106  0.979306  0.880236  0.937500

                               

Scoring Coefficients Estimated by Regression

Squared Multiple Correlations of the Variables with each Factor

   FACTOR1   FACTOR2

   1.000000  1.000000

Standardized Scoring Coefficients(标准因子得分模型中的系数)

                                               FACTOR1   FACTOR2

                                    POP        0.20219   0.44884

                                    SCHOOL     0.26695  -0.30320

                                    EMPLOY     0.23403   0.40411

                                    SERVICES   0.32450  -0.05806

                                    HOUSE      0.27535  -0.31068

 

 

 

Initial Factor Method: Principal Factors

Partial Correlations Controlling all other Variables

(控制所有其余变量的偏相关)

               POP    SCHOOL    EMPLOY  SERVICES     HOUSE

POP        1.00000  -0.54465   0.97083   0.09612   0.15871

SCHOOL    -0.54465   1.00000   0.54373   0.04996   0.64717

EMPLOY     0.97083   0.54373   1.00000   0.06689  -0.25572

SERVICES   0.09612   0.04996   0.06689   1.00000   0.59415

HOUSE      0.15871   0.64717  -0.25572   0.59415   1.00000

Kaiser's Measure of Sampling Adequacy: Over-all MSA = 0.57536759

(抽样适当的Kaiser量度,包括所有变量的和每个变量的)

POP         SCHOOL    EMPLOY  SERVICES     HOUSE

0.472079  0.551588  0.488511  0.806644  0.612814

Prior Communality Estimates: SMC

     POP    SCHOOL    EMPLOY  SERVICES     HOUSE

0.968592  0.822285  0.969181  0.785724  0.847019

Eigenvalues of the Reduced Correlation Matrix:

(约化相关矩阵的特征值)

Total = 4.39280116  Average = 0.87856023

                    1           2           3           4           5

Eigenvalue        2.7343      1.7161      0.0396     -0.0245     -0.0726

Difference        1.0182      1.6765      0.0641      0.0481

Proportion        0.6225      0.3907      0.0090     -0.0056     -0.0165

Cumulative        0.6225      1.0131      1.0221      1.0165      1.0000

2 factors will be retained by the PROPORTION criterion.

Factor Pattern

            FACTOR1   FACTOR2

SERVICES   0.87899  -0.15847

HOUSE      0.74215  -0.57806

EMPLOY     0.71447   0.67936

SCHOOL     0.71370  -0.55515

POP          0.62533   0.76621

Variance explained by each factor

FACTOR1   FACTOR2

2.734301  1.716069

Final Communality Estimates: Total = 4.450370

     POP    SCHOOL    EMPLOY  SERVICES     HOUSE

0.978113  0.817564  0.971999  0.797743  0.884950

                  Residual Correlations With Uniqueness on the Diagonal

(在对角线上是特殊因子方差的剩余相关)

                                  POP    SCHOOL    EMPLOY  SERVICES     HOUSE

                   POP        0.02189  -0.01118   0.00514   0.01063   0.00124

                   SCHOOL    -0.01118   0.18244   0.02151  -0.02390   0.01248

                   EMPLOY     0.00514   0.02151   0.02800  -0.00565  -0.01561

                   SERVICES   0.01063  -0.02390  -0.00565   0.20226   0.03370

                   HOUSE      0.00124   0.01248  -0.01561   0.03370   0.11505

                 Root Mean Square Off-diagonal Residuals: Over-all = 0.01693282

                              POP    SCHOOL    EMPLOY  SERVICES     HOUSE

                         0.008153  0.018130  0.013828  0.021517  0.019602

                            Partial Correlations Controlling Factors

(控制因子的偏相关)

                                  POP    SCHOOL    EMPLOY  SERVICES     HOUSE

                   POP        1.00000  -0.17693   0.20752   0.15975   0.02471

                   SCHOOL    -0.17693   1.00000   0.30097  -0.12443   0.08614

                   EMPLOY     0.20752   0.30097   1.00000  -0.07504  -0.27509

                   SERVICES   0.15975  -0.12443  -0.07504   1.00000   0.22093

                   HOUSE      0.02471   0.08614  -0.27509   0.22093   1.00000

                 Root Mean Square Off-diagonal Partials: Over-all = 0.18550132

(非对角偏相关的均方根,包括所有变量的和每个变量的)

                              POP    SCHOOL    EMPLOY  SERVICES     HOUSE

                         0.158508  0.190259  0.231818  0.154470  0.182015

 


表 36.4 主因子法的输出结果

 

Prerotation Method: Varimax

(预先旋转方法:正交最大方差旋转)

                                Orthogonal Transformation Matrix

(正交变换矩阵)

                                                1         2

                                      1      0.78895   0.61446

                                      2     -0.61446   0.78895

                                     Rotated Factor Pattern

(旋转后的因子模型)

                                             FACTOR1   FACTOR2

                                  HOUSE      0.94072  -0.00004

                                  SCHOOL     0.90419   0.00055

                                  SERVICES   0.79085   0.41509

                                  POP        0.02255   0.98874

                                  EMPLOY     0.14625   0.97499

                               Variance explained by each factor

                                         FACTOR1   FACTOR2

                                        2.349857  2.100513

                         Final Communality Estimates: Total = 4.450370

                              POP    SCHOOL    EMPLOY  SERVICES     HOUSE

                         0.978113  0.817564  0.971999  0.797743  0.884950


表 36.5  主因子法的正交最大方差预旋转结果

Rotation Method: Promax

(旋转方法:在正交最大方差旋转的基础上再斜交旋转)

                          Target Matrix for Procrustean Transformation

(用于Procrustean斜交变换的目标矩阵)

                                             FACTOR1   FACTOR2

                                  HOUSE      1.00000  -0.00000

                                  SCHOOL     1.00000   0.00000

                                  SERVICES   0.69421   0.10045

                                  POP        0.00001   1.00000

                                  EMPLOY     0.00326   0.96793

                               Procrustean Transformation Matrix

                                                1         2

                                      1      1.04117  -0.09865

                                      2     -0.10572   0.96303

                            Normalized Oblique Transformation Matrix

(正规化斜交变换矩阵)

                                                1         2

                                      1      0.73803   0.54202

                                      2     -0.70555   0.86528

                                   Inter-factor Correlations

(因子间的相关)

                                             FACTOR1   FACTOR2

                                  FACTOR1    1.00000   0.20188

                                  FACTOR2    0.20188   1.00000

                             Rotated Factor Pattern (Std Reg Coefs)

                                             FACTOR1   FACTOR2

                                  HOUSE      0.95558  -0.09792

                                  SCHOOL     0.91842  -0.09352

                                  SERVICES   0.76053   0.33932

                                  POP       -0.07908   1.00192

                                  EMPLOY     0.04799   0.97509

                                  Reference Axis Correlations

(参考轴相关)

                                             FACTOR1   FACTOR2

                                  FACTOR1    1.00000  -0.20188

                                  FACTOR2   -0.20188   1.00000

                         Reference Structure (Semipartial Correlations)

(半偏相关系数的参考结构)

                                             FACTOR1   FACTOR2

                                  HOUSE      0.93591  -0.09590

                                  SCHOOL     0.89951  -0.09160

                                  SERVICES   0.74487   0.33233

                                  POP       -0.07745   0.98129

                                  EMPLOY     0.04700   0.95501

                  Variance explained by each factor eliminating other factors

(每个因子在删去所有其他因子的作用后说明的方差)

                                         FACTOR1   FACTOR2

                                        2.248089  2.003020

                                Factor Structure (Correlations)

                                             FACTOR1   FACTOR2

                                  HOUSE      0.93582   0.09500

                                  SCHOOL     0.89954   0.09189

                                  SERVICES   0.82903   0.49286

                                  POP        0.12319   0.98596

                                  EMPLOY     0.24484   0.98478

                    Variance explained by each factor ignoring other factors

(不考虑其他因子的影响而被每个因子说明的方差)

                                         FACTOR1   FACTOR2

                                        2.447349  2.202280

                         Final Communality Estimates: Total = 4.450370

                              POP    SCHOOL    EMPLOY  SERVICES     HOUSE

                         0.978113  0.817564  0.971999  0.797743  0.884950


表 36.6  主因子法的Promax斜交旋转结果

Initial Factor Method: Principal Factors

                         Plot of Factor Pattern for FACTOR1 and FACTOR2

                                             FACTOR1

                                                1

                                           D   .9

                              E                .8

                               B               .7                   C                                                                     

                                               .6                     A

                                               .5

                                               .4

                                               .3

                                               .2                                                 

                                               .1                                                                            

                -1 -.9-.8-.7-.6-.5-.4-.3-.2-.1  0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1 0                                                                              

                                              -.1                             FACTOR2                                                                                      

                                              -.2

                                              -.3

                                              -.4

                                              -.5

                                              -.6

                                              -.7

                                              -.8

                                              -.9

                                               -1

               POP     =A    SCHOOL  =B    EMPLOY  =C    SERVICES=D    HOUSE   =E


表 36.7  主因子法的没有旋转因子模型图

Prerotation Method: Varimax

                         Plot of Factor Pattern for FACTOR1 and FACTOR2

                                             FACTOR1

                                               E1

                                               .B

                                               .8           D

                                               .7                                                                                         

                                               .6                    

                                               .5

                                               .4

                                               .3

                                               .2                                                 

                                               .1                            C                                                

                -1 -.9-.8-.7-.6-.5-.4-.3-.2-.1  0 .1 .2 .3 .4 .5 .6 .7 .8 .9 A 0                                                                              

                                              -.1                             FACTOR2                                                                             

                                              -.2

                                              -.3

                                              -.4

                                              -.5

                                              -.6

                                              -.7

                                              -.8

                                              -.9

                                               -1

               POP     =A    SCHOOL  =B    EMPLOY  =C    SERVICES=D    HOUSE   =E


表 36.8  主因子法的方差最大预旋转因子模型图

 

Rotation Method: Promax

                      Plot of Reference Structure for FACTOR1 and FACTOR2

                     Reference Axis Correlation = -0.2019  Angle = 101.6471

                                             FACTOR1

                                              E 1

                                              B.9

                                               .8        D

                                               .7                                                                                         

                                               .6                    

                                               .5

                                               .4

                                               .3

                                               .2                                                

                                               .1                          C                                                

                -1 -.9-.8-.7-.6-.5-.4-.3-.2-.1  0 .1 .2 .3 .4 .5 .6 .7 .8 .9 1 0                                                                             

                                              -.1                           A FACTOR2                                                                              

                                              -.2

                                              -.3

                                              -.4

                                              -.5

                                              -.6

                                              -.7

                                              -.8

                                              -.9

                                               -1

               POP     =A    SCHOOL  =B    EMPLOY  =C    SERVICES=D    HOUSE   =E

 

表 36.9  主因子法的Promax斜交旋转因子模型图

3.       主要结果分析。

第1个factor过程输出见表36.2所示的简单统计数(Means and Standard Deviations)和相关系数(Correlations),以及见表36.3所示主成份分析结果。主成份分析的先验公因子方差估计按指定值为1(缺省值也为1),所以5个变量组成的相关矩阵的特征值之和为5,平均值为1。主成份法求解的结果表明有两个较大的特征值且都大于1,分别为2.873314和1.796660,能解释数据标准变异的93.4%,因而这两个主成份能基本概括和解释整个数据的信息。若使用三个主成份(解释变异的97.7%),则大多数情况下都能满足需要。factor过程依据特征值大于1的原则(确定因子个数的缺省准则)选择了前两个主成份因子。所以含有两个公因子的初始公因子模型为:

pop=    0.58096 +0.80642

school=  0.76704 -0.54476

employ= 0.67243 +0.72605

services=0.93239 -0.10431

house=  0.79116 —0.55818

第1和第2公因子能解释的方差分别为2.873314和 1.796660,5个标准化变量的最终公因子方差估计值之和为4.669974=2.873314+1.796660=0.987826+0.885106+0.979306+0.880236 +0.937500。特征值与它的特征向量之间有如下等式,例如,2.873314=0.580962+0.767042+ 0.672432+0.932392+0.791162。第1主成份因子factor1在5个变量上的因子载荷量皆为正值,其中它与services的相关特别大(0.93239),总体上大小基本相近,可称为基本社会因子。第2主成份因子factor2在pop(0.80642)和employ(0.72605)上有较大的正载荷量,而在house(-0.55818)和school(-0.54476)上有绝对值较大的负载荷量,在services(-0.10431)上的载荷量非常小。所以,第2主成份因子是反映了地区的总人口和总雇佣人口与地区的房价和教育水平的对比值,可称为人口就业因子。最终公因子方差表明,所有变量都能由这两个因子很好他说明,其公因子估计值从services的0.880236到pop的0.987826的范围内。

主成份生成的标准因子得分具有均值为0方差为1。但计算得到的因子得分仅仅是真正因子得分的估计,这些估计具有均值为0,方差等于该因子同这些变量的复相关系数的平方。所以,每个标准因子得分的系数计算,可以通过每个因子与所有变量的回归分析得到的,标准因子得分模型为:

=0.20219pop+0.26695school+0.23403employ+0.32450services+0.27535house

=0.44884pop-0.30320school+0.40411employ-0.05806services-0.31068house

第2个factor过程进行主因子分析,规定每个变量的先验公因子方差估计使用与其他所有变量复相关系数的平方(priors=smc)。主因子分析的选项要求计算抽样适当的Kaiser度量(msa)。如果数据适合这个公因子模型,显然应该在控制所有其余变量的条件下,两变量之间的相关系数(此时称为偏相关系数)应该比原始的相关系数小。我们比较表36.4中的两变量间的偏相关系数与前面表36.2中两变量的原始相关系数,pop和school间的偏相关系数为-0.54465,它的绝对值比原始相关系数0.00975大得多,这表明有问题,此外不满足条件的偏相关还有,pop和house之间、school和employ之间、employ与house之间。msa指标是度量偏相关比原始相关小多少的综合指标,它既提供了所有变量一起考虑的msa值,又提供了单个变量的msa值,为我们直观快速判断因子模型拟合好坏提供了标准。msa的值在0.8以上是好的,msa的值在0.5以下需要采取补救措施,或者删除一些违法的变量,或者引入与违法变量有关的其他变量。显然所有变量的msa=0.57536759是很差的,单个变量除了services变量的msa=0.806644很好外,其余都很差甚至不能接受。所以,每个变量作为一个因子或者说每一个因子只包含一个变量的因子模型是不能接受的。共同使用的经验法则是每个因子至少应该包含有三个变量。

先验公因子方差估计smc都很大(接近于1),如pop=0.968592 ,school= 0.822285 ,employ=0.969181,services= 0.785724 ,house=0.847019,而主成份分析的五个变量先验公因子方差估计都设定为1,因此,主因子分析的因子载荷应该与主成份分析没有大的差异。约化相关矩阵的特征值之和=0.968592+0.822285+0.969181+0.785724+0.847019=4.39280116,平均值为0.87856023。两个很大的特征值2.7343和1.7161很明显地表示,应提取二个公因子。这两个大的正特征值之和占公共方差4.39280116的(2.7343+1.7161)/4.39280116=101.31%,它像没有进行迭代时才可能得到的一样,非常接近100%。对被保留因子个数的规定为,保留因子的特征值之和占公共方差的比例大于proportion=p选项中p值,p的缺省值为100%。

主因子分析过程绘制了特征值的(scree)斜坡图,图形在这里我们没有给出。从图中我们可以看出在第三个特征值处有明显的弯曲,也就是说从第三个特征值开始变成了在平地上,而不是在斜坡上。从观察到的斜坡图上也可证明取二个公因子的结论是正确的。

见表36.4中给出的主因子模型,它类似于主成份模型。所有最终公因子方差都很接近于先验的公因子方差,值得注意的只有house从0.847019增加到0.884950。接近100%的公共方差被解释了。在对角线上的特殊因子方差剩余相关都很小,且与最终公因子方差之和等于1。例如pop变量的最终公因子方差为0.978113,特殊因子方差为0.02189,两者之和0.978113+0.02189=1。变量之间的剩余相关也很小,最大值为house与services之间的0.03370。

输出对所有变量和对每个变量的非对角偏相关的均方根。例如,所有变量的非对角偏相关的均方根为0.01693282,pop变量的非对角偏相关的均方根为0.008153。

最后输出控制因子的偏相关阵及对所有变量和对每个变量的非对角偏相关的均方根。本例因为特殊因子的方差很小,故偏相关其实不是很重要。以上的这些结果分析表明先验公因子方差估计smc虽很好,但可能不完全是最佳的公因子方差估计。

从表36.7中看出,没有旋转的因子模型中变量可分为两个很紧凑的类,house(E)和school(B)在factor2的负方向末端。employ(C)和pop(A)在factor2的正方向末端。services(D)在EB和CA中间但靠近负端。我们希望有一种factor1和factor2参考轴好的旋转使得新的factor1和factor2参考轴穿过EB和CA这两个类。输出结果表36.8中,给出了正交最大方差(varimax)预旋转的因子模型结果。正交最大方差旋转使得新的factor1参考轴穿过了EB类,但新的factor2参考轴还不能完全穿过CA类。输出结果表36.9中,给出了promax旋转的因子模型结果。解决了新的factor2参考轴穿过CA类的问题,但此时新的factor1参考轴却不能穿过了EB类。本例我们可以用Harris-Kaiser旋转得到既factor1参考轴穿过EB类,又factor2参考轴穿过CA类的因子模型,程序和结果在这里我们省略了。问题的关键是我们通过vaximax或promax旋转达到了简化因子模型的目的。factor1参考轴穿过或靠近EB类,使得EB的因子表达式在f1因子上有较大的载荷,而在f2因子上几乎没有载荷;factor2参考轴穿过或靠近CA类,使得CA的因子表达式在f2因子上有较大的载荷,而在f1因子上几乎没有载荷。所以,我们很容易分析出,f1因子是与地区的房价水平和教育水平有主要关系的地区经济发达因子,而f2因子是与地区的总人口数和雇佣人口数有主要关系的地区人口规模因子。

输出结果表36.5中,给出了对主因子分析法得到的因子模型,进行正交最大方差旋转的有关结果,即:

 

输出结果表36.6中,给出了用promax斜交旋转的主因子分析。有关斜交旋转的详细说明我们在这里省略了。

阅读更多
个人分类: 多元统计
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭