SPSS—回归—多元线性回归结果分析(二)

SPSS—回归—多元线性回归结果分析(二)

,最近一直很忙,公司的潮起潮落,就好比人生的跌岩起伏,眼看着一步步走向衰弱,却无能为力,也许要学习“步步惊心”里面“四阿哥”的座右铭:“行到水穷处”,”坐看云起时“。

    接着上一期的“多元线性回归解析”里面的内容,上一次,没有写结果分析,这次补上,结果分析如下所示:

结果分析1:

由于开始选择的是“逐步”法,逐步法是“向前”和“向后”的结合体,从结果可以看出,最先进入“线性回归模型”的是“price in thousands"   建立了模型1,紧随其后的是“Wheelbase"  建立了模型2,所以,模型中有此方法有个概率值,当小于等于0.05时,进入“线性回归模型”(最先进入模型的,相关性最强,关系最为密切)当大于等0.1时,从“线性模型中”剔除

结果分析:

1:从“模型汇总”中可以看出,有两个模型,(模型1和模型2)从R2 拟合优度来看,模型2的拟合优度明显比模型1要好一些

(0.422>0.300)

2:从“Anova"表中,可以看出“模型2”中的“回归平方和”为115.311,“残差平方和”为153.072,由于总平方和=回归平方和+残差平方和,由于残差平方和(即指随即误差,不可解释的误差)由于“回归平方和”跟“残差平方和”几乎接近,所有,此线性回归模型只解释了总平方和的一半,

3:根据后面的“F统计量”的概率值为0.00,由于0.00<0.01,随着“自变量”的引入,其显著性概率值均远小于0.01,所以可以显著地拒绝总体回归系数为0的原假设,通过ANOVA方差分析表可以看出“销售量”与“价格”和“轴距”之间存在着线性关系,至于线性关系的强弱,需要进一步进行分析。


 

 结果分析:

1:从“已排除的变量”表中,可以看出:“模型2”中各变量的T检的概率值都大于“0.05”所以,不能够引入“线性回归模型”必须剔除。

 

从“系数a” 表中可以看出:

1:多元线性回归方程应该为:销售量=-1.822-0.055*价格+0.061*轴距

但是,由于常数项的sig为(0.116>0.1) 所以常数项不具备显著性,所以,我们再看后面的“标准系数”,在标准系数一列中,可以看到“常数项”没有数值,已经被剔除

所以:标准化的回归方程为:销售量=-0.59*价格+0.356*轴距

2:再看最后一列“共线性统计量”,其中“价格”和“轴距”两个容差和“vif都一样,而且VIF都为1.012,且都小于5,所以两个自变量之间没有出现共线性,容忍度和
膨胀因子是互为倒数关系,容忍度越小,膨胀因子越大,发生共线性的可能性也越大

 

 

从“共线性诊断”表中可以看出:

1:共线性诊断采用的是“特征值”的方式,特征值主要用来刻画自变量的方差,诊断自变量间是否存在较强多重共线性的另一种方法是利用主成分分析法,基本思想是:如果自变量间确实存在较强的相关关系,那么它们之间必然存在信息重叠,于是就可以从这些自变量中提取出既能反应自变量信息(方差),而且有相互独立的因素(成分)来,该方法主要从自变量间的相关系数矩阵出发,计算相关系数矩阵的特征值,得到相应的若干成分。

从上图可以看出:从自变量相关系数矩阵出发,计算得到了三个特征值(模型2中),最大特征值为2.847, 最小特征值为0.003

条件索引=最大特征值/相对特征值 再进行开方 (即特征值2的 条件索引为 2.847/0.150 再开方=4.351)

标准化后,方差为1,每一个特征值都能够刻画某自变量的一定比例,所有的特征值能将刻画某自变量信息的全部,于是,我们可以得到以下结论:

1:价格在方差标准化后,第一个特征值解释了其方差的0.02, 第二个特征值解释了0.97,第三个特征值解释了0.00
2:轴距在方差标准化后,第一个特征值解释了其方差的0.00, 第二个特征值解释了0.01,第三个特征值解释了0.99

可以看出:没有一个特征值,既能够解释“价格”又能够解释“轴距”所以“价格”和“轴距”之间存在共线性较弱。前面的结论进一步得到了论证。(残差统计量的表中数值怎么来的,这个计算过程,我就不写了)


 

从上图可以得知:大部分自变量的残差都符合正太分布,只有一,两处地方稍有偏离,如图上的(-5到-3区域的)处理偏离状态

    下班了,有时间继续写,百度空间发表文章,为什么过几分钟,就输入不了文字了啊

SPSS(Statistical Package for the Social Sciences)是一种统计分析软件,可以用来分析和处理数据。在SPSS分析变量的基本特征包括测量水平、集趋势、离散程度和分布形状等几个方面。 首先,测量水平是指变量的性质,可以分为分类变量和连续变量两种。分类变量是有限个数的取值,用标称尺度衡量,如性别、民族等;而连续变量是可以取任意数值的变量,用数值尺度衡量,如身高、体重等。 其次,集趋势是指变量的平均水平或心位置,用来描述数据的“心”在哪里。常用的集趋势指标有均值、位数和众数等。均值是所有观测值之和除以观测值个数,位数是将数据按大小排列后的间值,众数是出现频率最高的数值。 然后,离散程度是指变量的数据分散程度,用来描述数据的集程度。常用的离散程度指标有方差、标准差和范围等。方差是各观测值与均值之差的平方和的平均值,标准差是方差的正平方根,范围是最大观测值与最小观测值的差。 最后,分布形状是指变量的频数或概率分布形态,用来描述数据的分布情况。常用的分布形状指标有偏态和峰态等。偏态是分布曲线相对于心位置的对称性程度,可以是左偏态、右偏态或无偏态;峰态是分布曲线的陡峭程度,可以是高峰态、低峰态或正常峰态。 综上所述,SPSS分析变量的基本特征,可以通过测量水平、集趋势、离散程度和分布形状等指标进行描述和分析。这些特征有助于揭示数据的基本情况和分布规律,进而进行进一步的统计推断和决策分析
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值