量纲对回归结果的影响_应用回归分析-第3章课后习题参考 答案.doc

本文探讨了在多元线性回归中,样本容量n与自变量个数p的关系及其对模型参数估计的影响。强调了n>>p的重要性,解释了复相关系数R和样本决定系数与模型拟合效果的关系,并指出不能仅凭高决定系数判断回归方程理想。还讨论了回归方程显著性检验的意义,数据中心化和标准化的作用,以及R2与F值的关系。
摘要由CSDN通过智能技术生成

应用回归分析-第3章课后习题参考 答案

第3章 多元线性回归

思考与练习参考答案

3.1 见教材P64-65

3.2 讨论样本容量n与自变量个数p的关系,它们对模型的参数估计有何影响?

答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:n>>p。如果n<=p对模型的参数估计会带来很严重的影响。因为:

在多元线性回归模型中,有p+1个待估参数β,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。

解释变量X是确定性变量,要求,表明设计矩阵X中的自变量列之间不相关,即矩阵X是一个满秩矩阵。若,则解释变量之间线性相关,是奇异阵,则的估计不稳定。

3.3证明 随机误差项ε的方差s2的无偏估计。

证明:

3.4 一个回归方程的复相关系数R=0.99,样本决定系数=0.9801,我们能断定这个回归方程就很理想吗?

答:不能。复相关系数R与样本决定系数都是用来表示回归方程对原始数据拟合程度的好坏。样本决定系数取值在【0,1】区间内,一般来说,越接近1,即取值越大,说明回归拟合的效果越好。但由于的大小与样本容量n和自变量个数p有关,当n与p的值接近时,容易接近1,说明中隐含着一些虚假成分。而当样本容量n较小,自变量个数p较大时,尽管很大,但参数估计效果很不稳定。所以该题中不能仅仅因为很大而断定回归方程很理想。

3.5 如何正确理解回归方程显著性检验拒绝,接受?

答:一般来说,当接受假设时,认为在给定的显著性水平α之下,自变量,,…,对因变量y无显著性影响,则通过,,…,去推断y就无多大意义。此时,一方面可能该问题本应该用非线性模型描述,我们误用线性模型描述了,使得自变量对因变量无显著影响;另一方面可能是在考虑自变量时,由于认识上的局限性把一些影响因变量y的自变量漏掉了,这就从两个方面提醒我们去重新考虑建模问题。

当拒绝时,也不能过于相信该检验,认为该模型已经很完美。其实当拒绝H时,我们只能认为该回归模型在一定程度上说明了自变量,,…,与因变量y的线性关系。因为这时仍不能排除我们漏掉了一些重要自变量。此检验只能用于辅助性的,事后验证性的目的。(详细内容可参考课本P95~P96评注。)

3.6 数据中心化和标准化在回归分析中的意义是什么?

答:原始数据由于自变量的单位往往不同,会给分析带来一定的困难;又由于设计的数据量较大,可能会以为舍入误差而使得计算结果并不理想。中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响,避免不必要的误差。

3.7 验证

证明:多元线性回归方程模型的一般形式为:

其经验回归方程式为,

又,

故,

中心化后,则有,

左右同时除以,

令,

样本数据标准化的公式为

则上式可以记为

则有

3.8 验证

3.9 验证决定系数R2与F值之间的关系式:

3.10 验证决定系数R2与F值之间的关系式:

证明:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值