统计学习II.7 广义线性模型1 指数分布族

最新推荐文章于 2021-10-18 14:49:23 发布

一个不愿透露姓名的孩子

最新推荐文章于 2021-10-18 14:49:23 发布

阅读量559

点赞数

分类专栏：统计学习文章标签：机器学习统计学

本文链接：https://blog.csdn.net/weixin_44207974/article/details/112387622

版权

本文深入探讨了广义线性模型中的指数分布族，包括其定义、性质、MLE求解以及贝叶斯方法。通过伯努利分布和多项式分布举例，阐述了指数分布族在统计学习中的应用。

摘要由CSDN通过智能技术生成

统计学习II.7 广义线性模型1 指数分布族

指数分布族的定义
指数分布族的MLE
指数分布族的贝叶斯方法

这一部分介绍广义线性模型，这是一类监督学习方法，通常用来构造分类器等。考虑 ${(X_i,Y_i)\}_{i=1}^N$ ，广义线性模型通常假设 $Y_i$ 服从某种指数分布族。因此这一部分先介绍指数分布族，然后介绍基于不同指数分布族导出的广义线性模型的不同效果。

指数分布族的定义

用 $p(x|\theta)$ 表示某个密度函数，称它是指数分布族(exponential family)如果：
$p(x|\theta) = h(x)\exp(\theta^T \phi(x)-A(\theta))$

根据密度函数的归一性，
$\int p(x|\theta)dx =\int h(x)\exp(\theta^T \phi(x)-A(\theta))dx \\ = \exp(-A(\theta))\int h(x)\exp(\theta^T \phi(x))dx =1$

于是

$A(\theta)=\log Z(\theta), Z(\theta)=\int h(x)\exp(\theta^T\phi(x))dx$

其中 $\theta$ 被称为natural parameter， $\phi(X)$ 是这个指数族的充分统计量（基于Fisher-Neyman定理）， $Z(\theta)$ 是partition function， $A(\theta)$ 是cumulant function，如果 $\phi(X)=X$ ，称这样的指数族为自然指数族(natural exponential family)。

指数分布的另一种形式为
$p(x|\theta) = h(x)\exp(\eta(\theta)^T \phi(x)-A(\eta(\theta)))$ 如果 $\dim(\theta)<\dim(\eta(\theta))$ ，称之为curved exponential family，此时充分统计量的数目比参数多；如果 $\dim(\theta)=\dim(\eta(\theta))$ ，称之为canonical form；