多元线性回归分析spss结果解读_多重线性回归分析SPSS操作与解读

最新推荐文章于 2024-05-15 13:05:18 发布

weixin_39611340

最新推荐文章于 2024-05-15 13:05:18 发布

阅读量1.1w

点赞数 4

文章标签：多元线性回归分析spss结果解读

本文链接：https://blog.csdn.net/weixin_39611340/article/details/111512663

版权

转自个人微信公众号【Memo_Cleon】的统计学习笔记：多元线性回归。

这次笔记的内容是多元线性回归的SPSS操作及解读。严格来讲，这种一个因变量多个自变量的线性回归叫多变量线性回归或者多因素线性回归更合适一些。多元或者多变量往往指的是多个因变量。

在线性回归中，残差是一个非常重要的概念，它是估计值与观测值之差，表示因变量中除了分析的自变量外其他所有未进入模型的因素引起的变异，即不能由分析自变量估计的部分，在图形上表示观测值到拟合线的距离(注意不是垂直于拟合线的距离)。

适用条件

(1)线性趋势。因变量与自变量存在线性关系，一般通过散点图(简单线性相关)或散点图矩阵(多重线性回归)来做出简单的判断。此外，残差分析也可以考察线性趋势，偏残差图是更为专业的判断方法。如明显不成线性关系，应进行变量变换修正或改用其他分析。

(2)独立性。因变量各观测间相互独立，即任意两个观测的残差的协方差为0。可用Durbin-Watson检验是否存在自相关。

(3)正态性。对自变量的任一个线性组合，因变量均服从正态分布。此处正态分布意为对某个自变量取多个相同的值，对应的多个因变量观测值呈正态分布。但在实际获得的样本中，某一个自变量的固定的取值往往只有有限几个甚至只有1个，其对应的因变量随机观测值也只有几个甚至1个，是没有办法直接进行考察的。在模型中转换为考察残差是否符合正态分布。

(4)方差齐性。同正态分布类似，模型需要利用残差图考察残差是否满足方差齐性。方差不齐可进行加权的最小二乘法。

(5)各自变量间不存在多重共线。存在多重共线可导致结果与客观事实不符、估计方程不稳定等诸多问题。逐步回归可以限制有较强关系的自变量进入方程，如存在多重共线，可以剔除某个造成共线性的自变量，或合并自变量，也可改用领回归、主成分回归、偏最小二乘法回归等。多重共线可以利用容差、方差膨胀因子、特征根、条件指数、方差比例、相关系数以及残差图等多种方法考察。

(6)因变量为连续变量，自变量不限。在实际操作中，遇到自变量为分类变量的时候，可用最优尺度回归(分类回归)。

多元线性回归建立模型并不难，但需要认证考察多元线性分析的条件，以及建立的模型是否能够最优的拟合数据。分析步骤：

(1)适用条件考察及处理：线性趋势、独立、正态、方差齐、不存在多重共线等，同时要注意强影响点。

(2)建立回归模型，并进行模型和偏回归系数的假设检验。

(3)模型拟合优劣考察：复相关系数R，决定系数R2，校正决定系数R2adj，残差均方或剩余标准差、赤池信息准则AIC、Cp。

特别说明：纳入那些变量进行分析是由研究者根据专业和经验结合统计结果决定，而不是单单根据统计结果来决定。当自变量较多需要进行筛选自变量时，不同的筛选方法、不同的纳入剔除标准，也会得到完全不同的结果，入选的不一定是最好的，没有纳入的也未必没有统计学意义，回归是为了控制混杂因素分析影响因素，还是为了估计与预测，不同的回归模型可能对某种用途是好的，对另外一种可能就不是最好的。本示例仅为演示SPSS操作。示例数据来自孙振球主编的《医学统计学》第三版。收集了27名糖尿病人的血清总胆固醇(TC)、甘油三脂(TG)、空腹胰岛素(RI)、糖化血红蛋白(HbAc1。本文图片中由于个人在软件录入时书写错误写成了HbAa1c)、空腹血糖(Glu)的测量值，试建立血糖与其他几项指标关系的多重线性回归方程。

SPSS操作步骤

(1)数据录入

(2)线性趋势考察：Graphs>>Chart Bulider

选择散点图/点图(Scatter/Dot)，双击散点图矩阵(Scatterplot Matrix)，将要分析的所有变量拖入横坐标的Scatter Matrix框，OK

(3)线性回归：Analyze>>Regression>>Linear……Dependent(因变量)：选入Glu；

Independent(自变量)：选入TC、TG、RI和HbAc1；

变量筛选方法(Method)：Stepwise

变量筛选方法SPSS提供了强行进入法(Enter)、逐步回归法(Stepwise)、剔除法(Remove)、向后移除法(Backward)以及向前选择法(Forward)。利用区块(Block)可以实现对不同的变量采用不同的筛选办法，将采用同一筛选方法的变量放在一个区块内即可。Enter：不涉及变量筛选，所选自变量全部纳入模型。

Forward：所有自变量与因变量分别进行简单的线性回归拟合，选出最重要的候选变量(有统计学意义且P值最小的自变量)引入模型，然后在已引入一个自变量的模型中，将剩余的自变量分别引入，找到有统计学意义且P值最小的组合，然后进行下一步的自变量引入，直至剩余的所有自变量均无统计学意义。

Backward：与Fordward相反，该法首先拟合包含所有自变量的模型，然后依次剔除不重要的变量(P值最大且无统计学意义)

Stepwise：结合了Forward和Backward法。在逐步引入自变量的同时，考察已引入模型的自变量是否还有统计学意义，如果没有则进行剔除。

Remove：规定为Remove的自变量从模型中强行剔除，一般与Block连用。

除了上述方法，还有一种理论上的最佳方法：最优子集法(Best Subset)，该法是将所有自变量的可能组合都拟合一遍，然后选出最佳的模型。SPSS中在自动建模(Automatic Linear modeling)中实现。

Selection Variables(筛选变量)：可通过Rule建立筛选条件

最低0.47元/天解锁文章

weixin_39611340

关注

4
点赞
踩
48

收藏

觉得还不错? 一键收藏
0
评论
多元线性回归分析spss结果解读_多重线性回归分析SPSS操作与解读

转自个人微信公众号【Memo_Cleon】的统计学习笔记：多元线性回归。这次笔记的内容是多元线性回归的SPSS操作及解读。严格来讲，这种一个因变量多个自变量的线性回归叫多变量线性回归或者多因素线性回归更合适一些。多元或者多变量往往指的是多个因变量。在线性回归中，残差是一个非常重要的概念，它是估计值与观测值之差，表示因变量中除了分析的自变量外其他所有未进入模型的因素引起的变异，即不能由分析自变量估计...
复制链接

扫一扫