Stata: AIC / BIC / MSE / MAE 等信息准则的计算

本文介绍了Stata中AIC、BIC和HQIC等信息准则及其计算公式,强调了它们在模型选择中的作用。此外,还讲解了MSE、MAE、R2和Adjusted R2等回归评价指标,并展示了在Stata中如何获取这些指标的命令。
摘要由CSDN通过智能技术生成

作者: 贺旭

Stata 连享会: 知乎 | 简书 | 码云 | CSDN

2019暑期“实证研究方法与经典论文”专题班-连玉君-江艇主讲

2019暑期“实证研究方法与经典论文”专题班-连玉君-江艇主讲

本篇推文将介绍 AIC,BIC 等信息准则以及在 Stata 中的相关命令。

1 信息准则

该小节将介绍 AIC , BIC 等信息准则以及在 Stata 中的相关命令

1.1 简介

经常的,在建模过程中,会有一些备选解释变量,选择不同的变量组合会得到不同的模型,而信息准则就是刻画这些模型相对于 “ 真实模型 ” 的信息损失。AIC, BIC, HQIC 等信息准则的计算公式为:

赤池信息量 (akaike information criterion):

A I C = − 2 l n ( L ) + 2 k AIC=-2 ln(L) + 2 k AIC=2ln(L)+2k

贝叶斯信息量 (bayesian information criterion):

B I C = − 2 l n ( L ) + l n ( n ) ∗ k BIC=-2 ln(L) + ln(n)*k BIC=2ln(L)+ln(n)k

汉南 - 奎因信息量 (quinn criterion):

H Q = − 2 l n ( L ) + l n ( l n ( n ) ) ∗ k HQ=-2 ln(L) + ln(ln(n))*k HQ=2ln(L)+ln(ln(n))k

其中 : L L L 是该模型下的最大似然, n n n 是数据数量, k k k 是模型的变量个数。

在模型拟合时,增加参数可使得似然概率增大,但是却引入了额外的变量,因此 AIC 和 BIC 都在目标式中添加了模型参数个数的惩罚项,也就是第二项。当 n ≥ 8 n≥8 n8 时, l n ( n ) ∗ k ≥ 2 k ln(n)*k≥2k ln(n)k2k,所以,BIC 相比 AIC 在大数据量时对模型参数惩罚得更多,导致 BIC 更倾向于选择参数少的简单模型。

1.2 信息准则的Stata命令

在估计完模型后用,用命令 estat ic 来获得模型的 AIC,BIC , 例如 :

. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型
. estat ic ///获得模型地AIC和BIC

结果为

Akaike's information criterion and Bayesian information criterion

-----------------------------------------------------------------------------
       Model |        Obs  ll(null)  ll(model)      df         AIC        BIC
-------------+------
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值