AIC信息

最新推荐文章于 2024-06-10 21:07:07 发布

知道不_zkl

最新推荐文章于 2024-06-10 21:07:07 发布

阅读量1.2k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_41500849/article/details/80321215

版权

机器学习专栏收录该内容

28 篇文章 2 订阅

订阅专栏

AIC信息

假设 $f$ 为可以反映真实情况的理想模型， $g$ 为用来近似真实情况的模型。两个模型见的 $Kullback-Leibler$ 信息距离（ $K-L$ 距离）是指有模型 $g$ 来近似 $f$ 所带来的信息损失。简称 $g$ 到 $f$ 的距离， $K-L$ 距离由式 $(1)$ 表示。

I (f, g) = \int f (x) l o g ⟮ f ( x ) f ( x | θ ) ⟯ d x (1)

$I(f,g)=\int f(x)log \lgroup \frac {f(x)} {f(x|\theta)} \rgroup dx \tag1$

$g$ 到 $f$ 的 $K-L$ 距离越小，则代表模型 $g$ 越好。整理式 $(1)$ 可知， $K-L$ 距离可以由两个 $f$ 的期望来表示，其中，第一个期望是仅与未知的真实集 $f$ 相关的定值。

I (f, g) = \int f (x) l o g (f (x)) d x - \int f (x) l o g (g (x | θ)) d x = E f [l o g (f (x))] - E f [l o g (g (x | θ))] = C - E f [l o g (g (x | θ))] (2)

$\begin{equation} \begin{aligned} I(f,g) &=\int f(x)log(f(x))dx - \int f(x)log(g(x|\theta))dx \\ &= E_f[log(f(x))]-E_f[log(g(x|\theta))] \\ &= C-E_f[log(g(x|\theta))] \end{aligned} \tag 2 \end{equation}$
则可以定义相对

K−L K − L $K-L$ 距离，比较不用模型

g g $g$ 的相对

K - L 的

$K-L的$ 距离大小，同样可以对模型优劣程度做比较

I (f, g) - C = - E f [l o g (g (x | θ))] (3)

$I(f,g) -C=-E_f[log(g(x|\theta))] \tag 3$
相对于

K−L K − L $K-L$ 距离在实际模型比较重仍然不适用，因为相对

K−L K − L $K-L$ 距离的计算依赖于真实集

f f $f$ ，

A k a i k e

$Akaike$ 提出了一种估计

K−L K − L $K-L$ 距离的特定方法。给定一个模型形式

g g $g$ ，存在一个特定模型参数

θ_{0}

$\theta _0$ ，使得

g g $g$ 到

f

$f$ 的

K−L K − L $K-L$ 距离最小。这个特定的模型参数

θ0 θ 0 $\theta_0$ 依赖于真实集

f f $f$ ，模型形式

g

$g$ ，以及样本集

x x $x$ 。所以，

A k a i k e

$Akaike$ 提出用极大似然估计出的

θ^ θ ^ $\hat \theta$ 来估计

θ0 θ 0 $\theta_0$ ，则模型挑选准则从相对

K−L K − L $K-L$ 距离的比较进一步转化成对期望估计的

K−L K − L $K-L$ 距离的比较：

E y E x [l o g ⟮ g ⟮ x | θ^(y) ⟯ ⟯] (4)

$E_yE_x[log \lgroup g \lgroup x|\hat\theta(y) \rgroup \rgroup] \tag 4$

Akaike A k a i k e $Akaike$ 发现这个

K−L K − L $K-L$ 距离的估计在实际情况中，存在过估计，过估计的量近似等于需要估计的模型参数个数

K+1 K + 1 $K+1$ 。即

l o g ⟮ L ⟮ θ^| d a t a ⟯ ⟯ - (k + 1) = C - E^θ^⟮ I ⟮ f, g^⟯ ⟯ (5)

$log \lgroup L \lgroup \hat \theta|data \rgroup \rgroup-(k+1) = C - \hat E_{\hat \theta}\lgroup I \lgroup f,\hat g \rgroup\rgroup \tag 5$
因此，

Akaike A k a i k e $Akaike$ 定义了期望相对

K−L K − L $K-L$ 距离来作为模型挑选的准则，称为

Akaike A k a i k e $Akaike$ 信息准则

（Akaike′sinformationCriterion,AIC) （ A k a i k e ′ s i n f o r m a t i o n C r i t e r i o n , A I C ) $（Akaike's information Criterion ,AIC)$ ，即：

A I C = - 2 l o g ⟮ L ⟮ θ^| y ⟯ ⟯ + 2 (k + 1)

$AIC = -2log \lgroup L \lgroup \hat \theta|y \rgroup\rgroup +2(k+1)$
特别的，用最小二乘法估计的方法简化上式，则

AIC A I C $AIC$ 可进一步表示为：

A I C = n l o g ⟮ σ^2 ⟯ + 2 (k + 1) (6)

$AIC = nlog \lgroup \hat \sigma^2 \rgroup+2(k+1) \tag 6$
式中，

σ^2 σ ^ 2 $\hat \sigma^2$ 是

σ2 σ 2 $\sigma^2$ 的极大似然估计；

n n $n$ 为样本大小；

R S S

$RSS$ 为残差平方和。

σ^2 = R S S n (7)

$\hat \sigma^2 = \frac {RSS} {n} \tag 7$

知道不_zkl

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
AIC信息

AIC信息假设fff为可以反映真实情况的理想模型，ggg为用来近似真实情况的模型。两个模型见的Kullback−LeiblerKullback−LeiblerKullback-Leibler信息距离（K−LK−LK-L距离）是指有模型ggg来近似fff所带来的信息损失。简称ggg到fff的距离，K−LK−LK-L距离由式(1)(1)(1)表示。 I(f,g)=∫f(x)log⟮f(...
复制链接

扫一扫