线性回归是极经典的统计方法,有严格的假设条件,能探索影响因素,能输出模型,能用于预测,神通广大,应用广泛。学统计分析,如果能把线性回归琢磨透了,那恭喜你已经进入统计世界了。
为此特地搜集了已经在微信平台公开发布的有关SPSS线性回归的各类教程、案例,经验,点击标题即可打开原文,供学习参考。
案例类
2.1 简单线性回归分析,但需要先满足7项假设:
假设1:因变量是连续变量
假设2:自变量可以被定义为连续变量
假设3:因变量和自变量之间存在线性关系
假设4:具有相互独立的观测值
假设5:不存在显著的异常值
假设6:等方差性
假设7:回归残差近似正态分布
2.2 那么,进行简单线性回归分析时,如何考虑和处理这7项假设呢?
A.假设1和假设2:与研究设计有关,需要根据实际情况判断。
假设3:散点图法,通过因变量和自变量的散点图进行直观地判断。
假设4-7:运行简单线性回归。
Analyze→ Regression→ Linear
Statistics:Regression Coefficient框内点选Confidence intervals,并在Residuals框内点选Durbin-Watson和Casewise diagnosis
Plots:分别在“Y:”和“X:”框内添加“*ZRESID”和“*ZPRED”
Standardized Residual Plots中点选Histogram和Normal probability plot。
根据结果,我们将逐一对假设4-7进行检验。
假设4:具有相互独立的观测值
Durbin-Watson检验:值分布在0-4之间,越接近2,观测值相互独立的可能性越大。
Durbin-Watson检验不是万能的。它仅适用于对邻近观测值相关性的检验(1st-order autocorrelation)。
其实,观测值是否相互独立与研究设计有关。如果研究者确信观测值不会相互影响,我们甚至可以不进行Durbin-Watson检验,直接认定研究满足假设4。
假设5:不存在显著的异常值
a. 散点图直观判断。
b. Casewise Diagnostics检验:检验标准是上下3倍标准差,并标记超出此范围的数据为潜在异常值。
假设6:等方差性
通过残差与回归拟合值或标准化残差与标准化预测值之间的散点图进行检验。
假设7:回归残差近似正态分布
残差分不直方图和正态P-P图。
教程类
-
SPSS教程:做多重线性回归,方差不齐怎么办?
加权最小二乘法(Weighted Least Squares,WLS)的方法来进行模型估计,即在模型拟合时,根据数据变异程度的大小赋予不同的权重,对于变异程度较小、测量更精确的数据赋予较大的权重,对于变异程度较大、测量不稳定的数据赋予较小的权重,从而使得加权后回归直线的残差平方和最小,保证拟合的模型具有更好的预测价值。
权重估计
SPSS操作:
Analyze → Regression → Weight Estimation
结果:
Log-Likelihood Values表中输出了在给定步长下每个指数值对应的对数似然值,选取对数似然值最大的一项为最优指数,因此本例中最终确定的最优指数值为3,即权重按照1/population3的函数关系来计算权重。同时系统会在确定最优指数的情况下,自动生成一个名为WGT_1的变量用于保存权重系数。
经验类
说明:
以上7篇案例、4篇教程、3篇经验,共14篇文章由数据小兵选自以下微信公众号平台,欢迎长期订阅跟踪学习。
「SPSS统计训练营」
「医咖会」
「狗熊会」
「一起学统计工具」
「SPSS学堂」
「呼叫中心数据分析」
互联网给我们提供丰富学习资源的同时,也造成信息泛滥,小兵将有选择的、集锦式的收纳和推荐相关学习资源,欢迎持续关注。