我们在用SPSS做多元线性回归分析时,其结果是看标准化系数还是非标准化系数呢?分析之前要不要对数据标准化?不同影响因素的单位不同,要不要统一单位或对数据标准化呢?
第一,回归分析反映的是变量之间的关系,即X变化一个单位而Y变化几个单位,因此,如无特别需要,可以直接用各变量的原始数据进行分析,而无需对数据统一单位或数据标准化。
第二,SPSS等软件的回归分析自动输出标准化和非标准化的系数,因此可以直接获得标准化和非标准化的系数,而无需事先对数据标准化之后再进行回归分析。
第三,如果想知道解释变量之间谁对因变量影响更大,那么一个简单的做法是比较标准化系数,但这种方法也只是基于简单的观察和比较而不是统计检验,例如标准化回归系数0.35与0.33之间的差异并不一定具有统计学意义。
第四,当解释变量是分类变量时,标准化回归系数难以做出有意义的解释,此时用非标准化系数更好解释。
第五,在做实际预测时,要使用非标准化系数和截距,也就是建立非标准化回归方程,而不是标准化回归方程。