4.1 选择解释变量
- 经济理论高于统计结果
- 遗漏变量后,参数估计有偏误且非一致,方差减小
- 加入了不相干变量后,无偏但是非有效,方差增大,t检验失败
- 赤池信息准则(AIC)和施瓦茨信息准则(SC)
- A I C = 2 k n + ln R S S n AIC=\frac{2k}{n}+\ln{\frac{RSS}{n}} AIC=n2k+lnnRSS
- S C = k n ln n + ln R S S n SC=\frac{k}{n}\ln{n}+\ln{\frac{RSS}{n}} SC=nklnn+lnnRSS
- AIC和SC准则对增加解释变量加大了惩罚,其中SC惩罚比AIC更严厉。相对而言,AIC和SC的值越低,模型越好
- 模型设定准则
- 变量在方程中应当含义清晰
- t检验,解释变量参数的估计值在预期假设下应当显著
- 调整的判定系数或AIC和SC,加入变量后整体拟合优度应改善
- 偏误,将变量加入方程后,其他变量参数是否有显著变化
- 模型设定搜索
- 数据挖掘
- 适当的数据挖掘有利于揭示经济论尚未说明的经济规律
- 不适当的数据挖掘,相当于对数据严刑拷打,过度解释
- 敏感性分析:稳定性(robust)分析
- 数据挖掘
4.2 模型设定
- 函数形式的选择
- 不含常数项的回归
- 回归模型的函数形式
- 函数形式的选择
- 不含常数项的模型
- Y i = β 1 X i + ε i Y_i=\beta_1X_i+\varepsilon_i Yi=β1Xi+εi
- 可以证明:
- 参差均值不一定为0
- 拟合优度的判定系数可能出现负值
- 除非有非常强的先验经验,否则还是采取含有常数项的模型
- 参数线性,不限制变量线性,下列可线性化的非线性函数
- 指数函数
- y i = a e b x t + ε t ⇒ ln y t = ln a + b x t + ε t y_i = ae^{bx_t+\varepsilon_t} \Rightarrow \ln{y_t}=\ln{a}+bx_t+\varepsilon_t yi=aebxt+εt⇒lnyt=lna+bxt+εt
- 半对数线性模型,如复利公式:
-
Y t = Y 0 ( 1 + r ) t e ε t ⇒ ln Y t = ln Y 0
- 指数函数