【计量统计】计量经济学导论常见公式原理及习题解答

最新推荐文章于 2025-01-25 22:58:05 发布

CodeLuweir

最新推荐文章于 2025-01-25 22:58:05 发布

阅读量1.1w

点赞数 8

分类专栏：计量统计文章标签：计量统计

本文链接：https://blog.csdn.net/wyll19980812/article/details/127842709

版权

计量统计专栏收录该内容

5 篇文章

订阅专栏

关键词：[Stata] [计量经济学] [习题解答]

在这里插入图片描述

一、简单二元回归模型

$y = b_0 + b_1x + u$

$b_0$ , $b_1$ 被称为回归系数。 $b_0$ 也被称为常数项或截矩项，或截矩参数。
$b_1$ 代表了回归元 x 的边际效果，也被称为斜率参数;
$u$ 为误差项或扰动项，它代表了除了 x 之外可以影响y的因素

$wage= b_0 + b_1educ + u$

误差项 u 的平均值为零？ $y = (b_0 +5)+ b_1x + (u-5)$ ， $E (u^{'}) = E (u - 5) = 0$ ，上述推导说明我们总可以通过调整常数项来实现误差项的均值为零

条件期望零值假定

$E (u ∣ x) = E (u)$ ，我们需要对 u 和 x 之间的关系做一个关键假定。理想状况是对 x 的了解并不增加对 u 的任何信息。换句话说，我们需要 u 和 x 完全不相关；

普通最小二乘法的推导

$C o v (X, Y) = E (X Y) - E (X) E (Y)$

$E [(A + B) C] = E [A C] + E [B C]$

由 $E (u ∣ x) = E (u) = 0$ 可得 $C o v (x, u) = E (x u) = 0$

OLS 法是要找到一条直线，使残差平方和最小。残差是对误差项的估计，因此，它是拟合直线（样本回归函数）和样本点之间的距离；

在这里插入图片描述

正式解一个最小化问题，即通过选取参数而使下列残差值的和最小:

$\sum_{i=1}^{n}{(\hat{u}_{i})^2}=\sum_{i=1}^{n}(y_i-\hat{\beta}_{0}-\hat{\beta}_{1}x_{i})^2$

$E[y – b_0 – b_1x] = 0$ => $E[x(y – b_0 – b_1x)] = 0$

从而 $\sum_{i=1}^{n}{x_{i}(y_i-\hat{\beta}_{0}-\hat{\beta}_{1}x_i)}=0$

从而 $\sum_{i=1}^{n}{x_{i}\hat{u}_i}=0$

OLS 的代数性质

OLS 残差和为零，因此 OLS 的样本残差平均值也为零；

OLS回归线总是通过样本的均值: $\overline{y}=\hat{\beta}_{0}+\hat{\beta}_{1}\overline{x}$

把每一次观测看作由被解释部分和未解释部分构成： $y_i=\hat{y}_i+\hat{u}_i$
预测值和残差在样本中是不相关的： $cov(\hat{y}_i,\hat{u}_i)=0$

推导 $cov(\hat{y}_i,\hat{u}_i)=0$

由于 $C o v (X, Y) = E (X Y) - E (X) E (Y)$ ， $cov(\hat{y}_i,\hat{u}_i) = E(\hat{y}_{i} \hat{u}_{i})-\overline{y}E(\hat{u}_{i})$
因为 $E(\hat{u}_{i})=0$ ，所以 $cov(\hat{y}_i,\hat{u}_i) = E[(\hat{\beta}_0+\hat{\beta}_1x_i)\hat{u}_i] = \hat{\beta}_0E(\hat{u}_{i})+\hat{\beta}_1E(x_i\hat{u}_{i})$
因为 $E(\hat{u}_{i})=0$ ， $E(x_i\hat{u}_{i})=0$ ，所以 $cov(\hat{y}_i,\hat{u}_i)=0$

残差平方和

$S S T = S S E + S S R$

总平方和 $SST=\sum_{i=1}^{n}{(y_i-\overline{y})^2}$ ，对 y 在样本中所有变动的度量；
解释平方和 $SSE=\sum_{i=1}^{n}{(y_i-\hat{y})^2}$ ，度量了 y 的预测值在样本中的变动；
残差平方和 $SSR=\sum{\hat{u}_i^2}$ ，残差平方和度量了残差的样本变异；

拟合优度 R方

如何衡量样本回归线是否很好地拟合了样本数据，拟合优度计算公式： $R^2 = SSE/SST = 1 – SSR/SST$ ，可被看作是 y 的样本变动中被可以被 x 解释的部分；

当回归中加入另外的解释变量时， $R_2$ 通常会上升
例外：如果这个新解释变量与原有的解释变量完全共线，那么OLS不能使用
如果OLS恰好使第二个解释变量系数取零，那么不管回归是否加入此解释变量，SSR 相同
如果OLS使此解释变量取任何非零系数，那么加入此变量之后，SSR 降低了；实际操作中，被估计系数精确取零是极其罕见的，所以，当加入一个新解释变量后，一般来说，SSR 会降低；

调整过的 R方

$R_2$ 增加并不意味着加入新的变量一定会提高模型拟合度；

调整过的 R2 是 R2 一个修正版本，当加入新的解释变量，调整过的 R2 不一定增加

$\overline{R}^2=1-\frac{n-1}{n-k-1}\frac{SSR}{SST}$

调整过的 R2 是 1 减去 OLS 残差的样本方差（修正过自由度之后）与 y 的样本方差之比
因为 $(n - 1) / (n - k - 1) > 1$ ，所以调整过的 R2 总比 R2 小
加入一个解释变量有两个相反的效果：1）SSR 降低导致调整过的 R2 增加；2） $(n - 1) / (n - k - 1)$ 增加导致调整过的 R2 降低
调整过的 R2 可能是负的，发生在以下情况：所有解释变量使残差平方和下降的太少，不足以抵消因子 $(n - 1) / (n - k - 1)$
R2 只有在过原点回归中才可能为负

OLS 的无偏性

$\hat{\beta}_0=\overline{y}-\hat{\beta}_1\overline{x}=\beta_0+\beta_1\overline{x}+\overline{u}-\hat{\beta}_1\overline{u}=\beta_0+(\beta{1}-\hat{\beta}_1)\overline{x}+\overline{u}$

所以， $E(\hat{\beta_0})=\beta_0+E[(\beta{1}-\hat{\beta}_1)\overline{x}]+E(\overline{u})=\beta_0$

OLS 估计量的抽样方差

在一个附加假定下计算这个方差会容易的多，因此有 $Var(u|x)=\sigma^2(Homoskedasticity)$

$E(y|x)=b_0 + b_1x$ ， $\sigma^2$ ，方差； $\sigma$ 标准方差

误差方差 $\sigma^2$ 越大，斜率估计量的方差也越大

误差方差估计量

回归的误差： $\hat{\sigma}^2=\frac{1}{n-2}\sum{\hat{u}_i^2}=SSR/(n-2)$

回归的标准误： $\hat{\sigma}$

二、多元回归分析：估计

假设 1-5

假设 MLR.1 对参数而言为线性

在总体模型(或称真实模型）中，因变量 y 与自变量 x 和误差项 u 关系如下

$y= b_0+ b_1x_1+ b_2x_2+ …+b_kx_k+u$

其中， $b_1, b_2 …, b_k$ 为所关心的未知参数，u 为不可观测的随机误差项或随机干扰项

假定 MLR.2 随机抽样性：从总体中随机抽取若干个样本

假定 MLR.3 零条件均值

$E(u| x_{i1} , x_{i2},…, x_{ik})=0$

当该假定成立时，我们称所有解释变量均为外生的；否则，我们则称解释变量为内生的

假定 MLR.4 不存在完全共线性

在样本中，没有一个自变量是常数，自变量之间也不存在严格的线性关系；当一个自变量是其它解释变量的严格线性组合时，我们说此模型有多重共线性；

当 $n < (k + 1)$ 也发生完全共线性的情况，即样本数量小于自由度 +1 时；

OLS 的无偏性：无偏性是估计量的特性，而不是估计值的特性。估计量是一种方法（过程），该方法使得给定一个样本，我们可以得到一组估计值。我们评价的是方法的优劣

如果在设定中包含了不属于真实模型的变量，这是过度设定，对我们的参数估计没有影响，OLS仍然是无偏的；但它对OLS估计量的方差有不利影响；
如果在设定中排除了一个本属于真实模型的变量，即遗漏变量，这是设定不足；此时 OLS 通常有偏

假定 MLR.5 同方差性

Assume Homoskedasticity: 同方差性假定： $Var(u|x_1 , x_2 ,…, x_k ) = \sigma^2$

意思是，不管解释变量出现怎样的组合，误差项 u 的条件方差都是一样的，如果这个假定不成立，我们说模型存在异方差性

误设模型的方差

在考虑一个回归模型中是否该包括一个特定变量的决策中，偏误和方差之间的消长关系是重要的；

真实模型是 $y = b 0 + b 1 x 1 + b 2 x 2 + u$ ，有 $Var(\hat{\beta}_1)=\frac{\sigma^2}{SST_1(1-R_1^2)}$

考虑误设模型是 $\tilde{y}=\tilde{\beta}_0 +\tilde{\beta}_1x_1$ ，有 $Var(\tilde{\beta}_1)=\frac{\sigma^2}{SST_1}$

当 x1 和 x2 不相关时， $Var(\tilde{\beta}_1)=Var(\hat{\beta}_1)$ ，否则 $Var(\tilde{\beta}_1)<Var(\hat{\beta}_1)$

用残差项构造一个误差项方差的估计： $\hat{\sigma}^2=SSR/(n-k-1)$ ，df 是自由度，观察点个数 - 被估参数个数

OLS 的有效性：高斯－马尔科夫定理

在假定 MLR.1.5下，OLS 是最优线性无偏估计量（BLUE）

最优：方差最小
线性：因变量数据的线性函数
无偏：参数估计量的期望等于参数的真值
估计量：产生一个估计量的规则

在这里插入图片描述

三、多元回归分析：推断

OLS 估计量的样本分布

Sampling Distributions of the OLS Estimators

假设 MLR.6 正态

当Gauss－Markov假设成立时，OLS是最优线性无偏估计,为了进行经典的假设检验，我们要在Gauss－Markov假设之外增加另一假设;

假设 MLR.6 （正态）：假设 u 与 $x 1, x 2, \dots, x k$ 独立，且 u 服从均值为 0，方差为 $\sigma^2$ 的正态分布

假设 MLR.1-MLR.6 被称为经典线性模型假设,满足这六个假设的模型称为经典线性模型
在经典线性模型假设下，OLS 不仅是 BLUE，而且是最小方差无偏估计量，即在所有线性和非线性的估计量中，OLS估计量具有最小的方差

如果正态假设不成立怎么办？此时是异方差情况，那么，通过变换，特别是通过取自然对数，往往可以得到接近于正态的分布，降低异方差性；

注意：大样本允许我们放弃正态假设（近似方式）

单个总体参数的假设检验：t 检验

Testing Hypothesis About a Single Population Parameter: The t test

$y=\beta_0+\beta_1x_1+...+\beta_kx_k+u$

研究如何对一个特定的 $\beta_j$ 进行假设检验

注意这是一个 t 分布，因此要用 $\hat{\sigma}^2$ 来估计 $\sigma^2$ ，自由度： $n - k - 1$

原假设： $\beta_j=0$

如果接受零假设，则认为控制 $x$ 其它分量后， $x_j$ 对 y 没有边际影响

T 值计算公式： $t_{\hat{\beta}_j}=\hat{\beta}_j/se(\hat{\beta}_j)$

$\hat{\beta}_j$ 是 $x_j$ 的系数值
$se(\hat{\beta}_j)$ 是 $\beta_j$ 的标准差

除了零假设外，我们需要替代假设 H1，并设定显著性水平，H1 可以是单边（单尾）或双边（尾）的，双边就是单边显著性水平*2；

如果我们愿意在5％的概率上错误地拒绝实际上为真的零假设，则说我们的显著水平为5％；

取定显著性水平 a 后，找到自由度为 $n - k - 1$ 的 t 分布的 $\alpha)$ 分位数 c，即临界值；
单尾：单边替代假设
在这里插入图片描述
注意：当 t 分布的自由度增大时，t 分布趋近于标准正态分布；

双尾：双边替代假设
在这里插入图片描述

P-value

计算 t 检验的 p 值
提前确定显著水平可能会隐藏关于假设检验的一些有用信息；另一种想法：如果将算得的t 统计量作为临界值，那么使得零假设被拒绝的最小显著水平是多少；这个水平称为 p 值。
对于双边检验 $p - v a l u e = P (∣ T ∣ > ∣ t ∣)$

小 p 值提供了拒绝零假设的证据，大 p 值不能提供证据拒绝零假设；
理解 p 值的其它角度：如果零假设为真，那么有多大的概率可以观察到算得的 t 值

经济重要性与统计显著性

统计显著性完全由t 统计量的大小决定
经济上的重要性强调估计系数的大小
权衡两者来判断解释变量对被解释变量的边际影响

置信区间

Confidence Intervals
由于随机取样误差的存在，我们不可能通过样本知道 $\beta$ 的准确值，但是利用来自随机样本的数据构造一个取值的集合，使得真值在给定概率下属于这个集合是可能的；这样的集合称为置信集，预先设定的真值属于此集合的概率称为置信水平（置信度）；

置信集是下限和上限之间所有可能的取值，故置信集为一个区间，称为置信区间；

如果 $t_{\hat{\beta}_j}=(\hat{\beta}_j-\alpha_j)/se(\hat{\beta}_j)$ 服从 $n - k - 1$ 自由度的 t 分布，简单的运算可以得到关于未知的 $\beta_{j}$ 的置信区间： $[\hat{\beta}_j-c·se\hat{\beta}_j,\hat{\beta}_j+c·se\hat{\beta}_j]$ ；

举例：
在这里插入图片描述

参数线性组合的假设检验

Testing Hypotheses About a Single Linear Combination of the Parameters
假设我们要检验是否一个参数等于另一个参数 $\beta_1 = \beta_2$ ，而不是检验 $\beta_1$ 是否等于一个常数

$t=\frac{\hat{\beta}_1-\hat{\beta}_2}{se(\hat{\beta}_1-\hat{\beta}_2)}$
$se(\hat{\beta}_1-\hat{\beta}_2)=\sqrt{Var(\hat{\beta}_1-\hat{\beta}_2)}$
$Var(\hat{\beta}_1-\hat{\beta}_2)=Var(\hat{\beta}_1)+Var(\hat{\beta}_2)-2Cov(\hat{\beta}_1,\hat{\beta}_2)$
所以， $se(\hat{\beta}_1-\hat{\beta}_2)=\sqrt{([se(\hat{\beta}_1)]^2+[se(\hat{\beta}_2)]^2-2s_{12})}$ ，其中 $s_{12}=Cov(\hat{\beta}_1,\hat{\beta}_2)$

Stata中，在 reg y x1 x2 … xk 后，可以输入 test x1 =x2 得到检验的p值

举例：竞选支出对选举结果的影响
$\beta_0 + \beta_1log(expendA) + \beta_2log(expendB) + \beta_3prtystrA + u$

$H0:\beta_1=-\beta_2$ ，然后： $\theta_1=\beta_1+\beta_2=0$
令 $\beta_1=\theta_1-\beta_2$
带入方程得 $\beta_0 +\theta_1log(expendA) + \beta_2[log(expendB) –log(expendA)] + \beta_3prtystrA + u$
这个模型与原模型相同，但是此时可以直接从回归中得到 $\beta_1 – \beta_2 = \theta_1$ 的标准差
参数的任何线性组合都可以用类似的手段进行检验

多个线性约束的假设检验：F检验

Testing Multiple Linear Restrictions: The F Test
是检验“排除约束”，即想知道是不是一组参数都等于0；

此时，零假设形如 $\beta_{k-q+1} = 0, ... , \beta_k = 0$ ，其中 $q$ 就是你要检验的参数个数；
替代假设 $H 1 : H 0 为假$

不能分别进行 t 检验，因为存在这样的可能性：在给定显著水平下，所有的参数都不显著，但是联合检验显著；出现这种情况的原因：解释变量很可能高度相关，即使变量实际上显著，结果中的较大的标准差也可能表明参数不显著；

或者换一个说法：我们想知道加入 $x_{k-q+1}, …, x_k$ 来降低 SSR 是否值得？
通过公式 $F=\frac{(SSR_r-SSR_ur)/1}{SSR_ur/(n-k-1)}$ ，其中 $r$ 表示约束， $u r$ 表示无约束， $q$ 是约束个数

由于 SSR 可能很大而不易处理，我们有另一个有用的公式，结合 $SSR = SST(1 – R^2)$
$F=\frac{(R_{ur}^2-R^2_r)/q}{(1-R_{ur}^2)/(n-k-1)}$ ，其中 $r$ 代表约束， $u r$ 代表无约束；

举个例子
在这里插入图片描述
排除约束的一个特殊情况是检验 $H 0 : b 1 = b 2 = \dots = b k = 0$
由于只带常数项的回归得到的 $R^2$ 为0，此时的 F 统计量应为 $F=\frac{R^2/k}{(1-R^2)/(n-k-1)}$

特殊情况：注意：如果由于自变量系数受到约束而使因变量发生改变的话，比如 $y = b_0 + b_1x_1 + b_2x_2 + . . . +b_kx_k + u$
$b_1$ 被限制为1，从而新的因变量为 $y - x$ ，则 R方构造的 F 统计量不再适用，只有 SSR 形式的公式适用

对于模型 $voteA = b_0 + b_1log(expendA) + b_2log(expendB) + b_3prtystrA + u$
零假设为： $H0: b_1 = 1, b_3 = 0$ ，代入进入将 $voteA - log(expendA) = b_0 + b_2log(expendB) + u$ 作为约束模型

四、多元回归分析：进一步的问题

数据的测度单位换算对OLS统计量的影响

改变解释变量测度单位的影响，注意是测量单位，不是对变量转换数学形式

t 统计量相同
R平方相同
SSR相同
SE相同

改变变量y的测度单位会导致系数和标准差相应的改变，所以解释变量系数显著性和对其解释没有改变；
改变一个变量x的测度单位会导致该变量系数和标准差的相应改变，所以所有解释变量显著性和对其解释没有改变；

重新定义变量

对数模型，如果被解释变量以对数形式出现，改变被解释变量度量单位对任何斜率系数没有影响（这应该不是指系数值，有待实际做分析确认）；
双对数模型，改变y测度单位将改变截距，不改变斜率系数；

对于变量的估计系数大小问题

被估计系数的大小是不可比较的
一个相关的问题是，当变量大小差别过大时，在回归中因运算近似而导致的误差会比较大

对数模型

OLS也可以用在 x 和 y 不是严格线性的情况，通过使用非线性方程，使得关于参数仍为线性

可以取x，y（一个或全部）的自然对数
可以用x的平方形式
可以用x的交叉项

对数模型 $ln(y) = b_0 + b_1x + u$ ， $b_1$ 近似是，给定一单位 x 的改变，y 的百分比变化，常被称为半弹性；

对数都是以 e 为底的自然对数形式！

比如：
$log(y)=\beta_0+\beta_1x_1$ ， $x$ 上升 1 个单位， $y$ 将变化 $(100\beta_1)\%$ ，如果 $y$ 当前值为 $y_0$ ，那么预计 $y$ 的值为 $y_0(1+\beta_1)$

近似证明：

$l n (y) = a + b x$ ， $ln(y_0)=a+bx_0$
那么 $y=e^{a+bx}$ ， $y_0=e^{a+bx_0}$ ， $(y-y_0)/y_0=\frac{e^{a+bx}-e^{a+bx_0}}{e^{a+bx_0}}=e^{b(x-x_0)}-1$
所以， $x$ 每上升一个单位， $y$ 新增了 $e^b-1$ ，再乘100的话就接近 $b\%$ ；
举例： $l n (y) = 3 + 0.018 x$ ， $x = 1$ 时， $y = 20.45$ ， $x = 2$ 时， $y = 20.82$
从而 $100*(20.82-20.25)/20.45=1.8\%$ ，跟系数乘以100近似；

为什么用对数模型？

取对数后变量的斜率系数，不随变量测度单位改变
如果回归元和回归子都取对数形式，斜率系数给出对弹性的一个直接估计
对于 $y > 0$ 的模型，条件分布经常偏斜或存在异方差，而 $l n (y)$ 就小多了，所以 $l n (y)$ 的分布窄多了，限制了异常（或极端）观测值(outliers)的影响；

一些经验法则关于什么类型的变量经常用对数形式

肯定为正的钱数：工资，薪水，企业销售额和企业市值
非常大的变量：如人口，雇员总数和学校注册人数等

一些经验法则关于什么类型的变量经常用水平值形式

用年测量的变量：如教育年限，工作经历，任期年限和年龄

可以以水平值或对数形式出现的变量：比例或百分比变量：失业率，养老保险金参与率；

对数模型的限制：

一个变量取零或负值，则不能使用对数
如果 y 非负但可以取零，则有时使用 $l o g (1 + y)$
当数据并非多数为零时，使用 $l o g (1 + y)$ 估计，并且假定变量为 $l o g (y)$ ，解释所得的估计值，是可以接受的
当 y 取对数形式时，更难以预测原变量的值，因为原模型允许我们预测 log(y) 而不是 y；

含二次式模型

其实就是复杂版的一元二次方程：

假如 $x$ 的系数为正， $x^2$ 的系数为负，那么开口向下，y 先随 x 增加而增加，再随 x 增加而减少；
假如 $x$ 的系数为负， $x^2$ 的系数为正，那么开口向上，y 先随 x 增加而减少，再随 x 增加而增加；
上述两种情况， $y=bx+ax^2$ ，转折点就是 $x_0=|\frac{b}{2a}|$

含交叉项

对于形式为 $y = b_0 + b_1x_1 + b_2x_2 + b_3x_1x_2 + u$ 的模型，我们不能单独将 $b_1$ 解释为关于 $x_1$ ，y变化的度量，我们需要将 $b_3$ 也考虑进来，因为 $\frac{\Delta y}{\Delta x_1}=\beta_1+\beta_3x_2$ ，所以，要总述 x1 对 y 的影响，比较典型地做法是在 x2 处估计上式；