机器学习之逻辑回归（logistic regression）

最新推荐文章于 2024-08-19 20:05:23 发布

代码与诗

最新推荐文章于 2024-08-19 20:05:23 发布

阅读量3.5k

点赞数 3

分类专栏：统计机器学习文章标签：机器学习算法 logistic回归 sigmoid softmax

本文链接：https://blog.csdn.net/weixin_38516136/article/details/78014477

版权

本文详细介绍了逻辑回归，包括sigmoid函数的数学概念、性质和导数，以及在二项逻辑回归中的应用。此外，还探讨了softmax函数，它是sigmoid的泛化，用于解决多分类问题。通过数学建模和梯度下降，展示了从二分类到多分类的逻辑回归过程。

摘要由CSDN通过智能技术生成

logistic函数形如“S”,具体公式如下：
$f(x)=\frac{L}{1+{e}^{-k(x-x_0)}}$
其中： $x_0$ 代表中点， $L$ 代表函数的最大值， $k$ 代表曲线的陡度。
标准的logistic函数（即sigmoid函数）， $x_0=0，k=1,L=1$ ，即：
$f(x)=\frac{1}{1+{e}^{-x}}$

概念
sigmoid是logistic函数的特例，如上所述， $x_0=0，k=1,L=1$ 时，logistic函数就退化为sigmoid函数。

$f (x) = 1 1 + e - x$ $f(x)=\frac{1}{1+{e}^{-x}}$
考察sigmoid函数的性质
- 关于（0,0.5)中心对称
- 值域： $f(x)\in$ [0,1]
- 梯度饱和： $x\to\infty,f(x)\to0$
- 简单变形：
  $f (x) = 1 1 + e - x = e x 1 + e x e x 1 + e x = 1 - e - x 1 + e - x \to f (x) = 1 - f (- x)$ $f(x)=\frac{1}{1+{e}^{-x}}= \frac{e^x}{1+e^x}\\ \frac{e^x}{1+e^x} = 1- \frac{{e^-}^x}{1+{e^-}^x}\to f(x)=1-f(-x)$
- 导数
  $f^{'}(x)=f(x)\times(1-f(x)) \in[0,\frac{1}{4}]$ ，梯度饱和的原因。推导如下：
  $f' (x) = (1 1 + e - x)' = e - x ( 1 + e - x ) 2 = e - x 1 + e - x \times 1 1 + e - x = 1 1 + e x \times e x 1 + e x (变形一) = f (x) \times (1 - f (x))$ $\begin{aligned} f^{'}(x) & ={(\frac{1}{1+{e^-}^x})}^{'}\\ & =\frac{{e^-}^x}{(1+{e^-}^x)^2}\\ & =\frac{{e^-}^x}{1+{e^-}^x}\times\frac{1}{1+{e^-}^x}\\ & =\frac{1}{1+e^x}\times\frac{e^x}{1+e^x} (变形一)\\ & =f(x)\times(1-f(x)) \end{aligned}$
应用
- 神经网络中的激活函数
- 分类问题：二项逻辑回归（sigmoid回归）

基本概念
softmax也被称为指数规范函数，是logistic函数的泛化。通过把一个k维空间的向量 $z$ 的值（具有任意性）压缩到另一个k维空间的向量 $\sigma(z)$ ,它的每一个值都在(0,1)并且所有值的和为1（具有天然的概率分布的特性）,数学表示如下：
$σ : R K \to {z \in R K | z i \geq 0, \sum i = 1 K z i = 1} σ (z j) = e z j \sum k = 1 K e z k, j = 1, 2, . . ., K$ $\sigma:R^K\to\{z\in R^K|z_i\ge0,\sum\limits_{i=1}^Kz_i=1\} \\ \sigma(z_j)=\frac{e^{z_j}}{\sum\limits_{k=1}^Ke^{z_k}},j=1,2,...,K$
矩阵形式：
$σ (z) = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ σ (z 1) σ (z 2) . . . σ (z K) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ = 1 \sum K k = 1 e z k ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ e$