通过综合案例,使自己能够掌握回归分析的各种方法,学会建立线性回归模型并进行预测。
1(1)根据文件price.data绘制销售价格与销量的散点图,包含回归线。如下图所示。散点的颜色与线的颜色要与样图不一致。
先读取数据,再根据数据绘制散点图。
再用abline加上回归线。
绘制得到的图形如下图所示。
(2)计算price.data文件中回归方程的回归系数,预测变量:销售价格,响应变量:销量。
可以得到截距为9.51,斜率为-1.38
(3)使用summary函数显示题2中回归检验的结果。
(4)使用confint()函数列出题2中回归系数的置信区间。
(5)当饮料的定价为5元时,预测每周的市场销售量,并计算95%的预测区间和置信区间。
可以得到预测定价为5元时的销量为2.58,95%的预测区间为1.41到3.744。
可以得到95%的置信区间为2.324到2.838
2.为估计山上积雪融化后对下游灌溉的影响,在山上建立一个观测站,测量最大积雪深度X(米)与当前灌溉面积Y(公顷),测得连续10年的数据存放在snow.data中。
(1)建立一元线性回归模型,求解,并验证系数,方程,或相关系数是否通过检验。
先建立一元线性回归模型:
再使用summary函数:
可以得到p<0.001 属于*** 显著相关 ,但截距项不明显,使用无截距项再次检验回归:
R2达到了0.9986,通过了显著性检验。
(2)计算回归系数和 β0和β1的95%的置信区间
β0和β1即截距和斜率,置信区间如下:
(3)现在测得今年的数据是X=7米,给出今年灌溉面积的预测值,预测区间和置信区间。( =0.05)
预测今年的灌溉面积为2690,预测区间为95%
置信区间为0.95: