我们用SPSS做多元线性回归时,有多个自变量X,它们单位不同,大小有异,所以就会有人问在回归前是否要对原始数据进行标准化处理?
答案是:不需要
我们简单看一个例子。比如下方这个多元线性回归方程式,
其他条件不变时,自变量X3每增加一个单位,Y的预测值随之增加10.3个单位,这是对回归系数的解释。要注意的是,这个线性回归是在原始变量基础上进行拟合所得的结果,这个式子是含带物理单位的,自变量X和因变量Y在变化中都是携带实际意义的。
在这种情况下,我们很轻松的带入自变量X的具体取值,即可得到相应的Y值,预测效果直截了当,这是采取原始数据进行线性拟合的好处。
如果我们对原始数据采取了标准化处理,情况就不同了。
标准化处理后自变量、因变量的物理单位没有了,我们拿此时的线性回归方程做预测时就会十分麻烦,要对新的自变量取值进行标准化