从「一」到「无穷大」：广义线性模型 (GLM)

最新推荐文章于 2023-01-18 13:06:28 发布

anarion

最新推荐文章于 2023-01-18 13:06:28 发布

阅读量458

点赞数 3

分类专栏：统计学和机器学习文章标签：机器学习逻辑回归 gml 概率论统计学

本文链接：https://blog.csdn.net/weixin_42523849/article/details/106875864

版权

从「一」到「无穷大」：广义线性模型 (GLM)

本文基于「指数分布族」的理论，以「Logistic回归」为例，讲解推广线性模型的过程。

如果你还不了解指数分布族，请看：指数分布族

本文的md源码地址：AnBlogs

文章目录

从「一」到「无穷大」：广义线性模型 (GLM)

Logistc回归举个例子

先讲解Logistc预测使用的概率模型「伯努利分布」，并把它写成「指数族分布」的形式，再看看预测是如何操作的。

如果你还不了解Logistic回归，请看：Logistic回归

原始概率模型

「Logistic回归」解决一个二分类问题，二分类问题就是求对象分到某个类的概率，用伯努利分布描述。
$p(y|\mu)=\mu^{y}(1-\mu)^{1-y}$
以上形式就是在说 $p(y=1|\mu)=\mu$ ，只是把 $y = 0, y = 1$ 的情况融合在一起。

这里需要使用一点术语， $\mu$ 称为均值参数，意在它表达了分布的均值，或者可以直接叫做参数。

指数族分布形式 (Exponential Family)

伯努利分布写成指数族分布形式如下：
$p(y|\mu)=(1-\mu)\exp(y\ln\frac{\mu}{1-\mu}),\frac{1}{Z}=1-\mu,\phi(y)=y,\theta=\ln\frac{\mu}{1-\mu}$
如果你对这个结论不了解，请看：指数分布族

这里给出了 $\mu\rightarrow\theta$ 的映射，称为 $\Psi$ ，也就是 $\theta=\Psi(\mu)$ 。这个映射是从原始参数到自然参数的映射。这里说「原始参数」是为了和「自然参数」相区分。

这个映射是可逆的，是Sigmoid函数：
$\mu=\frac{1}{1+e^{-\theta}}=A'(\theta),\Psi^{-1}(\theta)=sigm(\theta)$
最终的指数族分布形式为：
$p(y|\mu)=\exp(y\theta-A(\theta)),A(\theta)=\ln(1+e^\theta)$

和线性组合连接 (Link Function)

我们通常通过 $w^Tx$ 的值估计目标 $y$ 分布的参数，进而求得分布。

比如在线性回归中， $w^Tx$ 直接确定了目标 $y$ 的均值，把方差当作常数，则目标 $y$ 的分布就确定了。在Logistic回归中， $w^Tx$ 的值带入Sigmoid函数，得到分布的参数 $\mu$

最低0.47元/天解锁文章

anarion

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
从「一」到「无穷大」：广义线性模型 (GLM)

从「一」到「无穷大」：广义线性模型 (GLM)本文基于「指数分布族」的理论，以「Logistic回归」为例，讲解推广线性模型的过程。如果你还不了解指数分布族，请看：指数分布族本文的md源码地址：AnBlogs文章目录从「一」到「无穷大」：广义线性模型 (GLM)Logistc回归举个例子原始概率模型指数族分布形式 (Exponential Family)和线性组合连接 (Link Function)推广总结详细说说连接函数 (Link Function)定义和意义函数的记号和术语如何选择没有多个要预
复制链接

扫一扫

专栏目录