多元线性回归分析spss结果解读_SPSS案例实践笔记:多重线性回归分析

本文通过一个案例介绍了如何使用SPSS进行多元线性回归分析,探讨了美国50个州犯罪率与其他因素的关系。研究发现,文盲率和人口数对犯罪率有显著影响,而其他因素影响不明显。通过残差分析,确认了模型的残差独立、残差正态性和残差方差齐次性,最终确定了回归方程式并讨论了异常值的影响。
摘要由CSDN通过智能技术生成

当只考察一个自变量对因变量的影响时,我们称之为简单一元线性回归,如果要多考察一些自变量,此时许多人习惯性将之称为多元线性回归,统计学上建议称之为多重线性回归,避免和多元统计方法冲突。

案例背景介绍

这是mei国50个州关于犯罪率的一组数据,包括人口、面积、收入、文盲率、高中毕业率、霜冻天数、犯罪率共7个指标,现在我们想考察一下州犯罪率和其他因素间的关系。SPSS变量视图如下:

研究目标是各州的犯罪率(因变量),可能的因素(自变量)是人口、面积、收入、文盲率、高中毕业率、霜冻天数。因变量犯罪率连续数值变量,有多个自变量,从研究目标和数据类型来看,可选用多重线性回归分析。

线性关系初步判断

线性回归要求每个自变量和因变量之间存在线性关系,可以依靠相关分析和散点图来初步判断。

犯罪率与文盲率、霜冻天数、高中毕业率、人口存在较为明显的线性关系,面积和其他变量普遍无关,越冷的地方文盲率越低、高中毕业率越高。

有统计学意义的相关系数依次为:0.703(文盲率)、-0.539(霜冻天数)、-0.488(高中毕业率)、0.344(人口)。除因变量外其他因素两两间相关系数均在0.7以下,因素间没有强相关关系存在,初步提示共线性问题较弱。

以上分析表明,并不是所有因素都有犯罪率存在明显线性关系,如果我们构建多重线性回归,这可能涉及到自变量筛选的问题,可优先选择逐步回归的方法。

共线性问

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值