AIC准则的理解

AIC = (-2)ln(模型的极大似然函数) + 2(模型的独立参数个数)

一、AIC准则的产生

(1)最终预报误差

对于自回归 A R ( k ) AR(k) AR(k)模型,用前 k k k期观测值的线性组合拟合当期序列取值,通过选择回归系数使得预测误差达到最小,即选择合适的 a i a_i ai,使得
s k 2 = 1 N ∑ ( y n − a 0 − a 1 y n − 1 − ⋯ − a k y n − k ) 2 s_k^2 = \frac1N\sum(y_n-a_0-a_1y_{n-1}-\cdots - a_ky_{n-k})^2 sk2=N1(yna0a1yn1akynk)2达到最小。
用预报误差的平均值来评价模型拟合的优劣,将其称为最终预报误差 F P E = E ( y n − a ^ k 0 − a ^ k 1 y n − 1 − ⋯ − a ^ k k y n − k ) 2 FPE =E(y_n-\hat{a}_{k0}-\hat{a}_{k1}y_{n-1}-\cdots - \hat{a}_{kk}y_{n-k})^2 FPE=E(yna^k0a^k1yn1a^kkynk)2因此模型的阶数 k k k的选择问题就等价为 F P E FPE FPE的极小化问题
赤池弘次已经提出,对于 A R ( k ) AR(k) AR(k)模型, F P E ( k ) = N + k N − k ( γ ( 0 ) − ∑ i = 1 k ϕ ^ i γ i ) FPE(k) = \frac{N+k}{N-k}(\gamma(0) - \sum_{i=1}^k \hat{\phi}_i \gamma _i) FPE(k)=NkN+k(γ(0)i=1kϕ^iγi)

(2)K-L距离(相对熵)

熵的概念来源于信息论,一般用于衡量信源发出的信息中包含的不确定性的大小,计算公式为 H = − ∑ i = 1 N p ( x i ) ⋅ l o g p ( x i ) H=-\sum_{i=1}^Np(x_i)\cdot \mathrm{log}p(x_i) H=i=1Np(xi)logp(xi)根据熵可以计算出用估计的概率分布近似代替原始数据分布时损失的信息。
K-L距离(相对熵)
p p p为实际概率分布, q q q为估计的概率分布,则K-L距离为 D ( P ∣ ∣ Q ) = E ( l o g P ( X ) Q ( X ) ) = ∫ p ( x ) l o g P ( x ) Q ( x ) d x D(P||Q)=E(\mathrm{log}\frac{P(X)}{Q(X)})=\int p(x)\mathrm{log}\frac{P(x)}{Q(x)}dx D(PQ)=E(logQ(X)P(X)=p(x)logQ(x)P(x)dx,当进行拟合时,希望两分布之间的K-L距离越小越好。

(3)AIC的产生

① 极大似然估计的本质

设因变量 Y Y Y具有条件概率密度函数 f ( y ∣ θ ) f(y|\theta) f(yθ),当使用极大似然法进行参数估计时,实际上是选择使得似然函数 L ( θ ) = f ( y 1 ∣ θ ) ⋯ f ( y N ∣ θ ) L(\theta) =f(y_1|\theta)\cdots f(y_N|\theta) L(θ)=f(y1θ)f(yNθ)达到最大的估计值 θ ^ \hat{\theta} θ^作为参数值。
由于 N → ∞ N\to \infty N时, 1 N ∑ l n f ( y i ∣ θ ) → E l n f ( Y ∣ θ ) \frac1N \sum lnf(y_i|\theta)\to Elnf(Y|\theta) N1lnf(yiθ)Elnf(Yθ)。因此 θ ^ \hat{\theta} θ^也是使得 E l n f ( Y ∣ θ ) Elnf(Y|\theta) Elnf(Yθ)达到最大的估计值。
Y Y Y的真实分布为 g ( y ) = f ( y ∣ θ 0 ) g(y)=f(y|\theta_0) g(y)=f(yθ0),则K-L距离: D ( g ( ⋅ ) ∣ ∣ f ( ⋅ ∣ θ ) ) = ∫ g ( y ) l n g ( y ) f ( y ∣ θ ) d y = E l n g ( Y ) − E l n f ( Y ∣ θ ) D(g(\cdot)||f(\cdot|\theta))= \int g(y)\mathrm{ln}\frac{g(y)}{f(y|\theta)}dy=E\mathrm{ln}g(Y)-E\mathrm{ln}f(Y|\theta) D(g()f(θ))=g(y)lnf(yθ)g(y)dy=Elng(Y)Elnf(Yθ)因此 θ ^ \hat{\theta} θ^即等价于使K-L距离达到最小的参数估计,这也是极大似然法的本质。

② 参数估计量的评价准则

类比 F P E FPE FPE准则,用 E [ D ( g ∣ ∣ f ( ∣ θ ^ ) ) ] E[D(g||f(|\hat{\theta}))] E[D(gf(θ^))]衡量参数估计量的好坏。(这里可以复习一下条件期望的知识),由于 E l n g ( Y ) E\mathrm{ln}g(Y) Elng(Y)为常数,因此只考虑 E [ E l n f ( Y ∣ θ ^ ) ] E[E\mathrm{ln}f(Y|\hat{\theta})] E[Elnf(Yθ^)]

③ AIC准则的导出

λ = max ⁡ l ( θ 0 ) max ⁡ l ( θ ^ ) \lambda = \frac{\max l(\theta_0)}{\max l(\hat{\theta})} λ=maxl(θ^)maxl(θ0),则当 N → ∞ N\to \infty N时, − 2 l n λ → χ 2 ( k ) -2\mathrm{ln}\lambda \to \chi^2(k) 2lnλχ2(k) k k k θ \theta θ的维数。
由于 E ( χ 2 ( k ) ) = k E(\chi^2(k))=k E(χ2(k))=k,因此 2 l ( θ ^ ) 2l(\hat{\theta}) 2l(θ^) 2 l ( θ 0 ) 2l(\theta_0) 2l(θ0)平均多 k k k,则可以导出AIC准则。
当模型为高斯过程时, F P E FPE FPE与AIC准则等价。

(4)AIC准则的评价

  • AIC准则的第一部分是极大似然函数的对数,是从样本信息对总体信息的反映程度即模型拟合情况考虑的;第二部分是对模型复杂度的惩罚,达到满足模型有效性和可靠性条件下参数个数最少。它既考虑了模型的拟合情况,又考虑了复杂度的影响,采用在同等拟合优度条件下参数最少的模型作为估计模型。
  • AIC准则突破了以往仅从模型拟合情况的评价标准,其出发点是最小化K-L距离(相对熵),需要同时满足有效性、可靠性和经济性。AIC值越小,估计概率分布越接近真实分布。
  • 大样本条件下,AIC准则中第二部分的惩罚较小,第一项起主导作用,最优模型不收敛于真实情况。

F P E FPE FPE准则到AIC准则的变化实际上是从预测值差异最小到预测分布差异最小的质的变化。

二、AIC准则的应用

  1. 模型定阶和模型选择
  2. 独立性检验
    列联表独立性检验中,对数似然函数为 l = ∑ i ∑ j n ( i , j ) l n p ( i , j ) l = \sum_i \sum_j n(i,j) \mathrm{ln} p(i,j) l=ijn(i,j)lnp(i,j)当对模型没有限制时,取 p ( i , j ) = n ( i , j ) / N p(i,j) = n(i,j)/N p(i,j)=n(i,j)/N可得最大似然函数值,且参数 p ( i , j ) p(i,j) p(i,j)中可自由取值的个数为 r c − 1 rc-1 rc1,此时AIC信息量为 A I C 1 = ( − 2 ) ∑ i ∑ j n ( i , j ) l n n ( i , j ) N + 2 ⋅ ( r c − 1 ) AIC_1=(-2)\sum_i \sum_j n(i,j) \mathrm{ln} \frac{n(i,j)}{N}+2\cdot (rc - 1) AIC1=(2)ijn(i,j)lnNn(i,j)+2(rc1)当对模型有独立性限制时, p ( i , j ) = p ( i , ⋅ ) p ( ⋅ , j ) , ∑ i p ( i , ⋅ ) = 1 , ∑ j p ( ⋅ , j ) = 1 p(i,j) = p(i, \cdot) p(\cdot,j), \sum_{i}p(i,\cdot) = 1,\sum_{j} p(\cdot, j) = 1 p(i,j)=p(i,)p(,j),ip(i,)=1,jp(,j)=1因此可自由取值的参数个数为 ( r − 1 ) ( c − 1 ) (r-1)(c-1) (r1)(c1),且取 p ( i , j ) = N ( i , ⋅ ) N ⋅ N ( ⋅ , j ) N p(i,j) = \frac{N(i,\cdot)}{N}\cdot \frac{N(\cdot,j)}{N} p(i,j)=NN(i,)NN(,j)时似然函数值达到最大,相应地可以计算出 A I C 2 AIC_2 AIC2
    A I C 2 < A I C 1 AIC_2 <AIC_1 AIC2<AIC1则应当采用有独立性约束模型。
    相比 χ 2 \chi^2 χ2独立性检验,AIC准则不需要主观决定显著性水平的值,因此AIC准则可以用于统计分析自动化
  3. 方差分析
    主要考虑方差分析模型中交互效应显著性问题。
    A I C = N l n ( 残 差 平 方 和 ) + 2 ( 自 由 度 ) AIC = N\mathrm{ln} (残差平方和) + 2(自由度) AIC=Nln()+2()
  4. 因子分析模型
    利用AIC准则确定公共因子的个数,使得公共因子既能解释原始变量较多的信息,又不会因为公共因子过多而造成解释信息冗余、增加解释既有因子的复杂度,同时减少了根据贡献率选择公共因子个数时的主观性作用。
    A I C = − 2 l n ( l ( θ ) ) + 2 ( 参 数 个 数 ) AIC = -2 \mathrm{ln} (l(\theta)) + 2(参数个数) AIC=2ln(l(θ))+2()其中, l n ( l ( θ ) ) = − 1 2 N [ l n ∣ Σ k ∣ + t r ( Σ k − 1 S ) ] \mathrm{ln} (l(\theta))= -\frac1 2 N[\mathrm{ln} |\Sigma_k| + tr(\Sigma_k^{-1}S)] ln(l(θ))=21N[lnΣk+tr(Σk1S)] S = 1 N ∑ ( y i − y ˉ ) ( y i − y ˉ ) ′ S = \frac1 N \sum (y_i - \bar {y})(y_i-\bar{y})' S=N1(yiyˉ)(yiyˉ) Σ k = A K A K ′ + D k \Sigma_k = A_KA_K' + D_k Σk=AKAK+Dk

参考文献:
[1] 李子奈.计量经济学模型方法论的若干问题[J].经济动态,2007(10):22-30.
[2] 陈晓峰.AIC准则及其在计量经济学中的应用研究[D].天津:天津财经大学,2012.
[3] 刘璋温.赤池信息量准则 AIC 及其意义[J].数学的实践与认识,1980(03):64-72.

  • 5
    点赞
  • 53
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要改进能量比 (Energy Ratio) -aic 准则的 MATLAB 代码,需要对原有的代码进行修改和优化。 首先,我们需要理解 Energy Ratio -aic 准则的计算方式。Energy Ratio- AIC 准则是一种模型选择准则,它基于数据的信息熵和模型的参数个数来评估模型的拟合优度。计算该准则的公式为: ER -aic = -10 * log10((mean_squared_error(模型拟合残差) - mean_squared_error(零模型残差))/mean_squared_error(零模型残差)) 然后,我们可以根据以上的公式编写 MATLAB 代码: ```matlab function energy_ratio = energy_ratio_aic(original_data, fitted_data) % 计算模型拟合残差 model_residual = original_data - fitted_data; % 计算零模型残差(使用均值作为预测值) zero_model_residual = original_data - mean(original_data); % 计算模型拟合残差的均方误差 model_mse = mean(model_residual.^2); % 计算零模型残差的均方误差 zero_model_mse = mean(zero_model_residual.^2); % 计算能量比 -aic 准则 energy_ratio = -10 * log10((model_mse - zero_model_mse) / zero_model_mse); end ``` 你可以将原数据和模型拟合数据作为参数传递给这个函数,它将返回能量比 -aic 的值。 请注意,这只是一个简单的示例代码,具体的改进取决于你的应用和数据的特点。此外,还可以考虑加入其他的改进措施,比如添加数据预处理步骤、采用更复杂的模型等,以提高能量比 -aic 准则的准确性和可靠性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值