逻辑斯蒂回归之sigmoid函数

最新推荐文章于 2024-05-28 17:15:54 发布

布纸所云

最新推荐文章于 2024-05-28 17:15:54 发布

阅读量1.1k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/XindiOntheWay/article/details/105306552

版权

机器学习专栏收录该内容

18 篇文章 2 订阅

订阅专栏

一. LR的数学形式

$h_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}$

二. LR为什么用sigmoid函数

2.1 广义线性模型(GLM)

GLM是 $y$ 服从指数族分布的一般分布模型。
首先需要知道，线性回归和逻辑斯蒂回归都是GLM的特殊形式：

在线性回归中假设 $y$ 服从高斯分布：
$\theta \sim \N(\mu,\sigma^2)$
在逻辑斯蒂回归中假设 $y$ 服从伯努利分布：
$\theta \sim Bernoulli(\phi)$
高斯分布和 $B e r n o u l l i$ 分布都属于指数分布族

2.2 指数族分布

在概率统计中，若某概率分布满足下式，我们称之为指数族分布：
$p(y;\eta)=b(y)e^{(\eta^TT(y)-a(\eta))}$

$\eta$ 为自然参数
$T (y)$ 为充分统计量(一般情况下 $T (y) = y$ )
$a(\eta)$ 是 log partition function , $e^{-a(\eta)}$ 起正规化常量的作用，保证 $\sum p(y;\eta)=1$
也就是所 $T, a, b$ 确定了一种分布， $\eta$ 是该分布的参数。
选择合适的 $T, a, b$ ，可以得到高斯分布和 $B e r n o u l l i$ 分布

2.3 Bernoulli分布的指数分布族形式

$\begin{aligned} p(y;\phi) & =\phi^{y}(1-\phi)^{1-y} \\ & = exp{(ln(\phi^{y}(1-\phi)^{1-y})} \\ & =exp({ln\frac{\phi^y}{(1-\phi)^y}(1-\phi)}) \\ & =exp((ln(\frac{\phi}{1-\phi}))y+ln(1-\phi)) \end{aligned} \Longrightarrow \begin{aligned} & \eta=ln(\frac{\phi}{1-\phi}) \longrightarrow \phi= \frac{1}{1+e^{-\eta}}\\ & T(y) =y \\ & a(\eta)=-ln(1-\phi)=ln(1+e^\eta)\\ & b(y)=1 \\ \end{aligned}$

2.4 广义线性模型建模的基本假设

用广义线性模型建模的假设：

$y$ 的条件概率属于指数分布族
- $\theta \sim \text{Exponential Family}$
给定 $x$ ，广义线性模型的目标是求解 $T (y) ∣ x$
- 在大多数情况下， $T (y) = y$ ，目标转变为求解 $y ∣ x$
- 即，希望拟合函数 $h_\theta(x)=E(y|x)$
- 譬如，在逻辑回归中 $h_\theta(x)=p(y=1|x,\theta)=0\cdot p(y=0|x,\theta)+1\cdotp(y=1|x,\theta)=E[y|x;\theta]$
$\eta$ 与 $x$ 是线性关系：
- $\eta=\theta^Tx$

2.5 广义线性模型推导出LR

$\begin{aligned} h_\theta(x) &=E[y|x;\theta] \\ & = \phi \\ & = \frac{1}{1+e^{-\eta}} \\ & =\frac{1}{1+e^{-\theta^Tx}} \end{aligned}$

参考资料

广义线性模型（Generalized Linear Model）

布纸所云

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
逻辑斯蒂回归之sigmoid函数

一. LR的数学形式hθ(x)=11+e−θTxh_\theta(x)=\frac{1}{1+e^{-\theta^Tx}}hθ(x)=1+e−θTx1二. LR为什么用sigmoid函数2.1 广义线性模型(GLM)首先需要知道，线性回归和逻辑斯蒂回归都是GLM的特殊形式：在线性回归中假设yyy服从高斯分布：y∣x;θ∼N(μ,σ2)y|x; \theta \sim \N...
复制链接

扫一扫

专栏目录