指数族分布和广义线性模型

最新推荐文章于 2023-04-09 21:45:29 发布

光与热

最新推荐文章于 2023-04-09 21:45:29 发布

阅读量506

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

17 篇文章 1 订阅

订阅专栏

本文将首先简单介绍指数族分布，然后介绍一下广义线性模型（generalized linear model, GLM), 最后解释了为什么逻辑回归（logistic regression, LR) 是广义线性模型的一种。

指数族分布

指数族分布 (The exponential family distribution),区别于指数分布（exponential distribution)。在概率统计中，若某概率分布满足下式，我们就称之属于指数族分布。

p (y; η) = b (y) exp (η T T (y) - a (η))

其中η的指数族分布.
统计中很多熟悉的概率分布都是指数族分布的特定形式，如伯努利分布，高斯分布，多项分布（multionmal), 泊松分布等。下面介绍其中的伯努利分布和高斯分布。

伯努利分布
$p (y; ϕ) = ϕ y (1 - ϕ) 1 - y = e x p [y log ϕ + (1 - y) log (1 - ϕ)] = e x p [y log ϕ 1 - ϕ + l o g (1 - ϕ)]$
把伯努利分布可以写成指数族分布的形式，且
$T (y) = y η = log ϕ 1 - ϕ a (η) = - log (1 - ϕ) = log (1 + e η) b (y) = 1$
同时我们可以看到ϕ=11+e−η, 居然是logistic sigmoid的形式，后面在讨论LR是广义线性模型时，也会用到。

高斯分布

高斯分布也可以写为指数族分布的形式如下：

p (y; μ) = 1 2 π --\sqrt exp (- 1 2 (y - μ) 2) = 1 2 π --\sqrt exp (- 1 2 y 2) exp (μ y - 1 2 μ 2)

p(y;\mu) =\frac{1}{\sqrt{2\pi}}\exp(-\frac{1}{2}(y-\mu)^2) \\

我们假设方差为1，当然不为1的时候也是可以推导的。上述我们就把高斯分布写为了指数族分布的形式，对应的

η = μ T (y) = y a (η) = μ 2 / 2 = η 2 / 2 b (y) = 1 2 π --\sqrt exp (- 1 2 y 2)

\eta = \mu \\ T(y) = y \\ a(\eta) = \mu^2/2 = \eta^2 /2 \\

广义线性模型 (Generalized linear model, GLM)

本节将讲述广义线性模型的概念，以及LR,最小二乘为何也属于广义线性模型。

考虑一个分类或回归问题，我们就是想预测某个随机变量y的函数。为了推导广义线性模式，我们必须做出如下三个假设

p(y|x;θ) 服从指数族分布
给了x
参数η

在这三个假设（也可以理解为一种设计）的前提下，我们可以推导出一系列学习算法，称之为广义线性模型(GLM)。下面我们可以推导出一系列算法，称之为广义线性模型GLM. 下面举两个例子：

最小二乘法

假设p(y|x;θ)∼N(μ,σ2),那么

h θ (x) = E [y | x; θ] = μ = η = θ T x

h_\theta(x) = E[y|x;\theta] \\ =\mu \\ =\eta \\
第一行因为假设2，第二行因为高斯分布的特点，第三行根据上面高斯分布为指数族分布的推导，第四行因为假设3

逻辑回归 LR

考虑LR二分类问题，y∈0,1),即服从伯努利分布。那么

h θ (x) = E [y | x; θ] = ϕ = 1 1 + e - η = 1 1 + e - θ T x

h_\theta(x) = E[y|x;\theta] \\ =\phi \\ =\frac{1}{1+e^{-\eta}} \\
第一行因为假设2，第二行因为伯努利分布的性质，第三行因为伯努利分布为指数族分布时的推导，第四行因为假设3.

所以我们终于知道逻辑回归LR的P(y=1|x)=11+e−θTx从何而来了。它即是在伯努利分布和广义线性模型的假设下推导而来，逻辑回归也自然是一种广义线性模型。

参考：
本文主要参加Andrew ng的机器学习讲义

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。