多元线性模型

本文详细介绍了多元线性模型的定义、参数估计与检验,包括回归方程的显著性检验和回归系数的显著性检验。通过实例展示了如何进行变量选择、回归诊断和回归预测,特别提到了异常点和影响点的探测。最后提供了多个实际问题的多元线性模型建立和分析的练习题。
摘要由CSDN通过智能技术生成

2章多元线性模型

多元回归模型通常用来研究一个因变量依赖多个自变量的变化关系,如果二者的依赖关系可以用线性形式来刻画,则可以建立多元线性模型来进行分析.本章介绍多元线性模型的定义、参数估计与检验、变量选择、回归诊断和回归预测.

2.1 多元线性模型

2.1.1 模型定义

多元线性模型通常用来描述变量y与x之间的随机线性关系,即

                                   (2.1)                                                                    

式中,

是非随机的自变量;y是随机的因变量;

是常数项;

,

,

是回归系数;

是随机误差项.

如果对y和x进行了n次观测,得到n组观测值

,它们满足以下关系式

  

引入矩阵记号,记

                (2.2)

则模型(2.1)可以写成如下形式

                                                      (2.3)

式中,y是n×1观测向量;X是n×(k+1)已知设计矩阵;e是n×1随机误差向量;β是(k+1)×1未知参数向量.

如果模型(2.3)满足条件:(1)E(

)=0,(2)Var(

)=

²I,(3)

互不相关,则称模型(2.3)为普通线性回归模型.

进一步,如果模型的随机误差项服从正态分布,即ε~N(0,

²I),则称模型(2.3)为普通正态线性回归模型.

【例2.1】(数据文件为eg2.1)某公司经理想研究公司员工的年薪问题,根据初步分析,他认为员工的当前年薪y(元)与员工的开始年薪

(元)、在公司的工作时间

(月)、先前的工作经验

(月)和受教育年限

(年)有关系,可能与性别

(男或女)也有关系.他随机抽样调查了36名员工,收集到如表2-1所示的数据.请将公司经理的分析用线性模型表示出来.

表2-1        抽样调查得到的36个人的数据资料

y

T1

T2

T3

T4

T5

y

T1

T2

T3

T4

T5

79220

14010

98

115

15

71120

11460

83

75

8

79670

13260

98

26

8

91520

22260

81

3

16

186320

81240

96

199

19

76220

12510

81

0

12

161945

46260

96

120

19

74420

12510

81

13

12

74570

15510

95

46

12

85220

17760

79

94

12

86120

15810

93

8

16

98570

22500

74

45

16

91520

20760

92

168

17

77420

12810

74

2

12

82820

20010

90

205

12

110720

35010

74

272

12

75620

16260

90

191

15

69020

11460

72

184

8

82220

16260

88

252

12

87920

19260

71

12

16

78020

14760

88

38

12

75770

13710

69

12

12

76370

14010

87

123

16

76520

20010

344

8

78020

14760

86

367

12

81620

17010

68

155

8

120570

43740

85

134

20

86570

14760

67

6

15

83270

16260

85

438

8

72170

14760

181

12

77570

16860

85

171

8

137570

46260

66

50

18

68420

1146

85

72

12

121320

23010

65

19

16

75320

14010

85

59

15

77570

17010

64

69

12

解:如果只考虑y与

,

,

之间的关系,则可以简单地表示为:

 

(2.4)

如果函数f是线性函数,即

,则模型(2.4)就是一个四元线性模型,如果模型的随机误差项服从正态分布,即

~N(0,

²I),则模型(2.4)是一个普通正态线性回归模型.

①这里对于随机误差向量方差的假定是经典假定,即Var(

)=

²I,一般的假定为Var(

)=

>0.

②如果要考虑性别

对年薪y的影响,可以将

数量化,变为虚拟变量,比如用

=0表示女性,用zs=

1表示男性.

2.1.2 模型的参数估计和检验

在正态假定下,如果X是列满秩的,则普通线性回归模型(2.3)的参数β的最小二乘估计为:

    (2.5)                                                                     于是y的估计值为:

(2.6)                                                                                            记残差向量为

,则随机误差方差

的最小二乘估计为:

 

                                                                    (2.7)

得到回归模型参数的估计值后,需要对回归方程和回归系数进行显著性检验.

1. 回归方程的显著性检验

原假设

备择假设

不全为0,当原假设成立时,检验统计量

                                                                        (2.8)

式中,

是四归平方和:

是残差平方和.对于给定的显著性水平a,检验的拒绝域为 

.

2. 回归系数的显著性检验

原假设

,备择假设

,当原假设成立时,检验统计量

                            (2.9)

式中,

是去掉

后的残差平方和.对于给定的显著性水平

,检验的拒绝域为

也可以采用以下检验统计量

                                (2.10)

式中,

对角线上的第

个元素.对于给定的显著性水平

  • 41
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是一个常用的多元线性模型结果分析模板,供参考: 1. 模型概述:首先,对多元线性模型进行总体概述,包括模型的目的、使用的自变量和目标变量的定义。 2. 模型拟合度分析: - 回归方程:给出多元线性回归方程,包括模型中每个自变量的系数(β)和截距(β0)。 - 拟合优度:通过判定系数(R-squared)来评估模型的拟合优度。R-squared值越接近1,表示模型对数据的拟合效果越好。 3. 自变量分析: - 系数解释:分析模型中每个自变量的系数(β)的符号和显著性,解释其与目标变量之间的关系。正系数表示正向关系,负系数表示负向关系。 - 显著性检验:使用统计假设检验方法(如t检验)来确定每个自变量的系数是否显著不为零。低于设定的显著性水平(通常为0.05)的系数被认为是显著的。 4. 模型诊断: - 残差分析:对模型的残差进行分析,检查它们是否满足模型假设(如误差项的正态性、独立性和同方差性)。 - 离群值分析:识别和分析离群值,检查它们是否对模型的拟合结果产生显著影响。 5. 预测能力评估: - 预测误差分析:使用各种指标(如均方根误差、平均绝对误差)来评估模型的预测能力。 - 交叉验证:使用交叉验证方法来评估模型在新数据上的泛化能力。 6. 结论和建议: - 结论总结:对模型的拟合结果进行总结,强调关键发现和主要影响因素。 - 建议提供:基于模型结果,提出相关建议和行动方案,以优化目标变量或改进业务决策。 请注意,以上模板仅供参考,具体的多元线性模型结果分析应根据具体问题和数据集的特点进行调整和补充。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值