许栩原创专栏《从入门到高手:线性回归分析详解》第9章:总体回归、置信度、置信区间及其计算方法。
多元回归方程求解后,我们分别确认了回归方程的精度和进行了回归方程的显著性验证,接下来,我们需要计算置信区间。
置信区间是回归分析的一个重要概念,但是,将回归分析应用到需求预测,并不强求引入置信区间,也就是说,用回归分析做需求预测时,可以不进行置信区间的计算,而直接进行后续的预测步骤。所以,从这一点来说,大家可以跳过本章,直接进入第10章,用线性回归分析进行预测。
不过,我们做回归分析,非常有必要懂得相关置信区间的概念、逻辑和计算方法。所以,本章,我还是对此做些基础的介绍,主要内容如下。(本专栏总目录如下图。)
1、总体回归。
2、置信度与置信区间。
3、置信区间的计算。
一、总体回归。
要了解置信区间,我们需要先了解回归分析的另一个概念,总体回归。
我们先看总体,请看下图。
回归火锅店的这一组数据中,气温为6℃,没有折扣(即折扣为1)这种情况有3天,分别是1月8日、12日和16日。但是,这仅仅是14天的数据,如果将数据放大,那么,以前肯定也有“气温为6℃,没有折扣”这种情况,以后(即需要预测的未来)也同样会存在这种情况。我们可将“气温为6℃,没有折扣”这种情况认为是一个总体,而1月8日、12日和16日是从这个总体中抽出的三个个体。
总体回归表明的是因变量y的平均状态随自变量x变化的规律。
回归分析认为ÿ