《计量经济学》第四版庞皓版(更新中……)

第二章 简单线性回归模型

2.1 回归分析与回归函数

相关关系于回归分析:

 ① 变量之间的相关关系类型:

从相关关系涉及的变量数量看
从相关关系涉及的表现形式看
从相关关系涉及的变化方向看
从变量相关的程度看

②相关关系的度量

\rho= \frac{Cov(X,Y) }{\sqrt{Var(X)Var(Y)}}

r_{XY}=\frac{\sum (X_{i}-\bar{X})(Y_{i}-\bar{Y})}{\sqrt{\sum (X_{i}-\bar{X})^{2}(Y_{i}-\bar{Y})^{2}}}

多个变量间的线性相关程度,则需要用复相关系数和偏相关系数去度量。

③相关系数的特点

    相关系数的取值特点:

                                    取到1,-1,[-1.0],[0.1],0时的含义

④使用相关系数时,应当注意的点:

 r_{XY}=r_{YX}
相关系数只反映变量间的线性相关程度,不能说明非线性相关关系
相关系数不能确定变量的因果关系,也不能说明相关关系具体接近于那条直线
样本相关系数时根据从总体中抽取的随机样本的观测值计算出来的,它只是对总体相关系数\rho的估计

 回归分析

① 回归分析VS相关性分析

回归分析VS相关分析
回归分析相关分析
联系先相关性分析,在回归分析若要测量相关关系的数量形式,需要用回归分析
区别有因果关系,解释变量为非随机变量,被解释变量为随机变量只能确定相关关系,不知因果,两个变量都是随机变量
目的时寻求变量间联系的具体数学形式,是要根据解释变量的固定值去估计和预测被解释变量的平均值目的是用一定的数量指标度量变量间相互联系的方向和程度
局限性不能决定经济现象相互间的本质联系,还需结合实践经验去分析,并要由经济学理论去加以说明不能说明变量间相关关系的具体形式

 ②总体回归函数(PRF):

E\left ( Y\mid X_{i} \right )= f\left ( X_{i} \right )= \beta _{1}+\beta _{1}X_{i}

   随机扰动项u_{i}

u_{i}= Y_{i}-E\left ( Y\mid X_{i} \right )= Y_{i}-\beta _{1}-\beta _{1}X_{i}

E\left ( Y\mid X_{i} \right )=E\left(E\left ( Y\mid X_{i} \right )\right )+E\left ( u_{i}\mid X_{i} \right )=E\left ( Y\mid X_{i} \right )+E\left ( u_{i}\mid X_{i} \right )                式(1)

式(1)暗含E\left ( u_{i}\mid X_{i} \right )=0

引进随机扰动项原因
作为未知影响因素的代表
作为无法取得数据的已知因素的代表
作为众多细小因素的综合代表
模型设定误差
变量的观测误差
经济现象的内在随机性

③样本回归函数(SRF)

\hat{Y}_{i}=\hat{\beta }_{1}+\hat{\beta}_{2}Y_{i}

Y_{i}=\hat{\beta }_{1}+\hat{\beta}_{2}Y_{i}+e_{i}

PRF VS SRF
PRFSRF
未知但确定随抽样抽样波动而变化,不是PRF,至多只是未知的总体回归线的近似反映
参数是确定的参数随抽样而变化的随机变量
u_{i}是不可直接观测的e_{i}是可以计算的

2.2 简单线性回归模型参数的估计

简单线性回归的基本假定 

①对变量和模型的假定

变量模型
假定解释变量X_{i}是确定性变量,也即非随机变量变量没有测量误差
或者解释变量虽然是随机的,但是和随机扰动项也是不相关的不存在设定误差:模型会变量和函数形式的设定是正确的

 ②对随机扰动项的假定

假定形式假定的应用Y_{i}的分布性质
假定1(零均值假定)(无偏性)E\left ( u_{i} \mid X_{i}\right )=0无偏性?E\left ( Y_{i} \mid X_{i}\right )=\beta _{1}+\beta _{2}X_{i}
假定2(同方差假定)(有效性、假设检验、区间估计)Var\left (u _{i} \mid X_{i}\right )=E\left [u_{i}-E\left (u _{i} \mid X_{i} \right ) \right ]^{2}=E\left ( u_{i}^{2} \right )=\sigma ^{2}同方差性?→异方差Var\left ( Y_{i} \mid X_{i}\right )=\sigma ^{2}
假定3(无自相关假定)(有效性)Cov(u_{i},u_{j})=E\left [u_{i}-E\left ( u_{i}\right ) \right ]\left [u_{i}-E\left ( u_{j} \right ) \right ]=E\left ( u_{i} u_{j} \right )=0无自相关性Cov\left ( Y_{i} \mid X_{i}\right )=0 (i\not\equiv j)
假定4(内生性)Cov(u_{i},X_{i})=E[u_{i}-E(u_{i})][X_{i}-E(X_{i})]有无内生性?
假定5 正态性假定u_{i}\sim N(0,\sigma ^{2})通过线性性判断参数的分布Y_{i}\sim N(\beta _{1}+\beta_{i}X_{i},\sigma ^{2})

 普通最小二乘估计

 ①OLS

min\sum e_{i}^{2}=min\sum(Y_{i}-\hat{Y_{i}})^{2}=min\sum(Y_{i}-\hat{\beta}_{1}-\hat{\beta}_{2}X_{i})^{2}

\frac{\partial( \sum e_{i}^2)}{\partial\hat{\beta}_{1}}=-2\sum(Y_{i}-\hat{\beta}_{1}-\hat{\beta}_{2}X_{i})=0\rightarrow \sum e_{i}=0                        (1)

\frac{\partial( \sum e_{i}^2)}{\partial\hat{\beta}_{2}}=-2\sum(Y_{i}-\hat{\beta}_{1}-\hat{\beta}_{2}X_{i})X_{i}=0\rightarrow \sum e_{i}X_{i}=0             (2)

(1)和(2)共同得出:

\hat{\beta}_{2}=\frac{\sum x_{i}y_{i}}{\sum x_{i}^{2}} \rightarrow \hat{\beta}_{1}=\bar{Y}-\hat{\beta}_{2}\bar{X}

③OLS回归线的性质

数学性质统计性质(研究所得出的参数估计量是否符合一定的标准)
1.\bar{Y}=\hat{\beta}_{1}+\hat{\beta}_{2}\bar{X}(所有的样本回归线和总样本回归线相交于一点)1.无偏性(0均值假定)
2.E(\hat{Y}_{i})=\bar{Y}2.有效性(0均值假定和同方差假定)
3.\hat{e}=o (使用正规方程)3.线性特性
4.r_{X_{i} e_{i}}=0
5.r_{Y_{i} e_{i}}=0

高斯——马尔可夫定理:在古典假定条件下,OLS估计量\hat{\beta}_{1}\hat{\beta}_{2}的最佳线性无偏估计量。

2.3拟合优度

目的:为了评价所建立的样本回归函数对样本观测值的拟合程度

总变差分解

 Y_{i}=\hat{Y}_{i}+e_{i}

(Y_{i}-\bar{Y})=(\hat{Y}_{i}-\bar{Y})+\hat{e}_{i}

TSS=ESS+RSS

可决系数

①可决系数表达式

R^{2}=\frac{ESS}{TSS}=\frac{\sum(\hat{Y}_{i}-\bar{Y})^{2}}{\sum(Y_{i}-\bar{Y})^{2}}=\frac{\sum\hat{y}_{i}^{2}}{\sum y_{i}^{2}}=\frac{\sum e_{i}^{2}}{\sum y_{i}^{2}}

 ②可决系数特点

可决系数式非负统计量
可决系数的取值范围为[0,1]
可决系数R^{2}是样本观测值的函数,是随抽样而变动的随机变量

可决系数VS相关系数

可决系数相关系数
联系R^{2}=r^{2}r=\pm \sqrt{R^{2}}
区别度量模型中解释变量对被解释变量变差的解释程度说明两个变量的线性依存度
是解释变量 于被解释变量不对称的因果关系涉及相关关系,无具体因果关系
[0,1][-1,1]

 2.4 回归系数的假设检验和区间估计

\hat{\beta}_{1}\sim N(\beta{1},\sigma ^{2}\frac{\sum X_{i}^{2}}{n\sum x_{i}^{2}})    

\hat{\beta}_{2}\sim N(\beta{2},\frac{\sigma ^{2}}{\sum x_{i}^{2}})

回归系数的假设检验条件服从分布回归系数的区间估计结果显著时
原假设\beta_{i}=0方差已知正态分布拒绝原假设
方差未知,小样本t分布(n-k)P[-t_{\alpha /2}\leq t=\frac{\hat\beta_{2}-\beta_{2}}{\hat{SE}(\hat{\beta}_{2})}\leq t_{\alpha/2}]=1-\alpha
方差未知,大样本正态分布

2.5回归模型的预测

被解释变量平均值预测被解释变量个别值预测
点预测区间预测
将预测或者实际的解释变量值代入,计算被解释变量

P\left \{ [\hat{Y}_{f}-t_{\alpha /2} \hat{SE}(\hat{Y}_{f})\leq E(Y_{f}\mid X_{f})\leqslant \hat{Y}_{f}+t_{\alpha /2} \hat{SE}(\hat{Y}_{f})] \right \}=1-\alpha

\hat{SE}(\hat{Y}_{f})=\hat{\sigma }\sqrt{\frac{1}{n}+\frac{(X_{f}-\bar{X})^{2}}{\sum x_{i}^{2}}}

P\left \{ [\hat{Y}_{f}-t_{\alpha /2} \hat{SE}(\hat{Y}_{f})\leq E(Y_{f}\mid X_{f})\leqslant \hat{Y}_{f}+t_{\alpha /2} \hat{SE}(\hat{Y}_{f})] \right \}=1-\alpha

\hat{SE}(\hat{Y}_{f})=\hat{\sigma }\sqrt{1+\frac{1}{n}+\frac{(X_{f}-\bar{X})^{2}}{\sum x_{i}^{2}}}

存在抽样误差,随着n增加可以无限趋近于0存在抽样误差和随意扰动项的误差,随着n增加,预测误差只取决于随机扰动项的方差

第三章 多元线性回归模型

3.1多元线性回归模型及古典假定

①多元线性回归模型——结合高代类比上一章理解

②古典假定——多了“无多重共线性假定”

3.2多元线性回归模型的估计

OLS——类比第二章

X^{'}e=0

\hat{\beta}=(X^{'}X)^{-1}X^{'}Y

Var-Cov(\hat{\beta})=\sigma ^{2}\left ( X^{'}X \right )^{-1}

 \sigma ^{2}=\hat{\sigma }^{2}=\frac{\sum e_{i}^{2}}{n-k}

3.3 多元线性回归模型的假设检验和区间估计

对模型整体显著性的检验拟合优度回归方程的显著性检验(F检验)
可决系数修正可决系数显著性检验
R^{2}=\frac{ESS}{TSS}多重可决系数是一个不减函数,如果用自由度去校正所计算的变差,可以纠正解释变量个数不同引起的对比困难\bar{R}^{2}=1-\frac{RSS/(n-k)}{TSS/(n-1)}在回归分析中,不仅要模型的拟合程度高,而且要得到总体回归系数的可靠估计量F=\frac{ESS/(k-1)}{TSS/(n-k)}
回归参数的检验(t检验)统计量检验区间估计
t_{\beta _{i}}=\frac{\hat{\beta }_2}{\hat{\sigma }\sqrt{c_{33}}}P[-t_{\alpha /2}(n-k)\leq t=\frac{\hat\beta_{j}-\beta_{j}}{\hat{SE}(\hat{\beta}_{j})}(n-k)\leq t_{\alpha/2}]=1-\alpha

3.4 多元线性回归模型的预测

被解释变量平均值被解释变量个别值预测
点预测区间预测区间预测
将预测或者实际的解释变量值代入,计算被解释变量[\hat{Y}_f-t_{\alpha /2}\hat{\sigma }\sqrt{X_{f}\left (X ^{'}X \right )^{-1}X_{f}^{'}}\leq E\left ( Y_{f}\leq \hat{Y}_f+t_{\alpha /2}\hat{\sigma }\sqrt{X_{f}\left (X ^{'}X \right )^{-1}X_{f}^{'}} \right )][\hat{Y}_f-t_{\alpha /2}\hat{\sigma }\sqrt{1+X_{f}\left (X ^{'}X \right )^{-1}X_{f}^{'}}\leq E\left ( Y_{f}\leq \hat{Y}_f+t_{\alpha /2}\hat{\sigma }\sqrt{1+X_{f}\left (X ^{'}X \right )^{-1}X_{f}^{'}} \right )]

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值