3)题目:要了解学校毕业生起始工资是否能用 GPA 和毕业时的年龄来解释,请利用样表数据来进行解释。(表格已经整理到 Excel 表格中,如下图所示:)
导入数据:
(1)试做回归模型并解释各项系数:
由此运算结果可得:多元线性回归函数为:
起始工资 = -5213.1 + 8508.8GPA + 181.6年龄
解释:
在 GPA 不变的情况下,年龄每增加一个单位,起始工资就增加 181.6 个单位;
在年龄不变的情况下,GPA 每增加一个单位,起始就工资增加 8508.8 个单位;
对其进行标准化偏回归系数计算:
(2)确定学生的 GPA 和年龄是否能真正用来解释起始工资样本的变化。
由结果可知 R^2=Multiple R-squared=0.6677 不接近 1,说明回归方程拟合度低,所
以不能用学校毕业生的 GPA 和毕业时的年龄一起来解释起始工资样本的变化。
但可单独使用 GPA 来解释起始工资样本的变化。
(3)预测某 GPA 为 3.0,年龄为 24 岁的毕业生的起始工资。
所以 GPA 为 3.0,年龄为 24 岁的毕业生的预测起始工资为 24671.16。
4)题目(邹么):研究货运总量 y_1(万吨)与工业总产值 x_1(亿元)、农业 总产值 x_2(亿元)、居民非商品支出 x_3(亿元)的关系。(表格已经整理到 Excel 表格中,如下图所示:
导入数据:
(1)计算出 y_1,x_1,x_2,x_3 的相关系数矩阵。
绘制矩阵散点图:
(2)求出 y_1 与 x_1,x_2,x_3 的多元线性回归方程。
由运算结果可得回归方程:
y_1^= -348.280 + 3.754x_1+7.101x_2+12.447x_3
对其进行标准化偏回归系数计算:
(3)对所求方程做拟合优度检验——>回归系数 t 检验:
由运算结果可知:
R^2=Multiple R-squared=0.8055 接近 1,说明回归方程拟合度高。
(4)由(3)回归方程可知显著性检验并每一个回归系数做显著性检验。
- F=8.283 > F0.05(3,6)=4.76,说明拒绝原假设 H0,x 与 y 有显著的线性关系。
- t_1=1.942<t0.05(8)=1.943,P1=0.1002>α=0.05,所以接受原假设,说明 x_1对 y 没有显著的影响
- t_2=2.465>t0.05(8)=1.943,P2=0.0488<α=0.05,所以拒绝原假设,说明 x_2对 y 有显著的影响
- t_3=1.178<t0.05(8)=1.943,P3=0.2835>α=0.05,所以接受原假设,说明 x_3对 y 没有显著的影响
(5)如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,并做回归方程的显著性检验和回归系数的显著性检验。由(4)题可知 P3=0.2835>α=0.05 是最大的,所以需要剔除 x_3,重新建立新的回归方程。
由运算结果可得回归方程:
y_1^= -459.624 + 4.676x_1+8.971x_2
再次进行显著性检验,对每一个回归系数做显著性检验。
- F=11.12>F0.05(2,7)=4.74,说明拒绝原假设 H0,说明拒绝原假设 x 与 y 有显著的线性关系 。
- t_1=2.575<t0.05(8)=1.943,P1= 0.03676 <α=0.05,所以拒绝原假设,说明 x1对 y 有显著的影响
- t_2= 3.634 >t0.05(8)=1.943,P2= 0.00835<α=0.05,所以拒绝原假设,说明 x2对 y 有显著的影响
所以得到最终回归方程为:
y_1^= -459.624 + 4.676x_1+8.971x_2
(6)使用逐步回归分析的逐步筛选法获得一个最优的回归模型。
使用逐步回归分析的逐步筛选法得到的回归模型方程为:
y_1^= -348.280 + 3.754x_1+7.101x_2+12.447x_3