Logistic回归模型介绍与python实现

最新推荐文章于 2024-05-16 05:30:00 发布

林ch

最新推荐文章于 2024-05-16 05:30:00 发布

阅读量3.4k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/linchuhai/article/details/89434153

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

1. 引言

对于回归问题，我们知道可以通过回归模型进行拟合，并挖掘各个特征变量对模板变量的影响机制，但是，对于分类问题，由于目标变量是离散型变量，因此，不能直接应用回归模型进行解决，这时，可以使用Logistic回归模型进行解决。

2. Logistic回归模型介绍

2.1 Logistic回归模型的介绍

首先介绍Logistic分布，假设 $X$ 是连续随机变量， $X$ 服从Logistic分布是指 $X$ 具有下列分布函数和密度函数：
$\begin{array}{l}{F(x)=P(X \leqslant x)=\frac{1}{1+\mathrm{e}^{-(x-\mu) / \gamma}}} \\ {f(x)=F^{\prime}(x)=\frac{\mathrm{e}^{-(x-\mu) / \gamma}}{\gamma\left(1+\mathrm{e}^{-(x-\mu) / \gamma}\right)^{2}}}\end{array}$ 其中， $\mu$ 为位置参数， $\gamma>0$ 为形状参数。密度函数和分布函数的分布图如下图所示。分布函数的图形是一条 $S$ 形曲线，该曲线的取值范围为 $(0, 1]$ ，并以点 $\left(\mu, \frac{1}{2}\right)$ 为中心对称，即有：
$F(-x+\mu)-\frac{1}{2}=-F(x-\mu)+\frac{1}{2}$
在这里插入图片描述
因此，对于分类问题，虽然不能直接用回归模型进行拟合，但是可以将其转化计算每一个类别的概率问题，因为概率的取值范围为 $[0, 1]$ ，因此，可以采用Logistic分布来进行拟合。

2.2 二项Logistic回归模型

对于二分类问题，假设随机变量为 $X$ ，目标变量为 $Y$ ，其取值为1或0，则可以通过Logistic模型来拟合条件概率分布 $P (Y ∣ X)$ ，具体如下：
$\begin{array}{l}{P(Y=1 | x)=\frac{\exp (w \cdot x+b)}{1+\exp (w \cdot x+b)}} \\ {P(Y=0 | x)=\frac{1}{1+\exp (w \cdot x+b)}}\end{array}$ 其中， $\in \mathbf{R}^{n}$ 是输入， $\in\{0,1\}$ 是输出， $\in \mathbf{R}^{n}$ 和 $\in \mathbf{R}$ 是参数， $w$ 称为权值向量， $b$ 称为偏置， $\cdot x$ 表示内积，这样的模型称为二项Logistic回归模型。
对于给定的输入实例 $x$ ，只需要按照上式计算 $P (Y = 1 ∣ x)$ 和 $P (Y = 0 ∣ x)$ 两个概率值，将 $x$ 分到概率值大的那一类即可实现分类。为了方便，可以对权值向量和输入向量加以扩充，即 $w=(w^{(1)},w^{(2)}, \cdots, w^{(n)}, b )^T$ ， $x=\left(x^{(1)}, x^{(2)}, \cdots, x^{(n)}, 1\right)^{\mathrm{T}}$ ，这时，可以将模型表达如下：
$\begin{array}{l}{P(Y=1 | x)=\frac{\exp (w \cdot x)}{1+\exp (w \cdot x)}} \\ {P(Y=0 | x)=\frac{1}{1+\exp (w \cdot x)}}\end{array}$ 将上述两式相除，即可得：
$\log \frac{P(Y=1 | x)}{1-P(Y=1 | x)}=w \cdot x$ 其中， $\operatorname{logit}(p)=\log \frac{p}{1-p}$ 称为事件 $P (Y = 1 ∣ x)$ 的对数几率，也就是说，事件 $P (Y = 1 ∣ x)$ 的对数几率可以由输入 $x$ 的线性函数表示的模型，即Logistic模型。

2.3 模型的参数估计

对于给定的训练数据集 $T=\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \cdots\right.,\left(x_{N}, y_{N}\right) \}$ ，其中， $x_{i} \in \mathbf{R}^{n}, \quad y_{i} \in\{0,1\}$ ，Logistic回归模型采用极大似然估计法估计模型的参数，假设：
$x)=\pi(x), \quad P(Y=0 | x)=1-\pi(x)$ 则似然函数为：
$\prod_{i=1}^{N}\left[\pi\left(x_{i}\right)\right]^{y_{i}}\left[1-\pi\left(x_{i}\right)\right]^{1-y_{i}}$ 对数似然函数为：
$\begin{aligned} L(w) &=\sum_{i=1}^{N}\left[y_{i} \log \pi\left(x_{i}\right)+\left(1-y_{i}\right) \log \left(1-\pi\left(x_{i}\right)\right)\right] \\ &=\sum_{i=1}^{N}\left[y_{i} \log \frac{\pi\left(x_{i}\right)}{1-\pi\left(x_{i}\right)}+\log \left(1-\pi\left(x_{i}\right)\right)\right] \\ &=\sum_{i=1}^{N}\left[y_{i}\left(w \cdot x_{i}\right)-\log \left(1+\exp \left(w \cdot x_{i}\right)\right]\right.\end{aligned}$ 对 $L (w)$ 求极大值，即可得到 $w$ 的估计值 $\hat{w}$ ，这样一来，对于任意给定的实例 $x$ ，就可以通过以下公式计算两个类别的概率，从而将概率值最大的类别作为预测的类别：
$\begin{array}{l}{P(Y=1 | x)=\frac{\exp (\hat{w} \cdot x)}{1+\exp (\hat{w} \cdot x)}} \\ {P(Y=0 | x)=\frac{1}{1+\exp (\hat{w} \cdot x)}}\end{array}$

2.4 多项Logistic回归

对于多分类问题，假设目标变量有 $K$ 个类，其取值集合为 $\{1,2, \cdots, K\}$ ，则Logistic回归模型会选择其中一个类别作为主类别，不妨以第 $K$ 类为主类别，然后将其与其他 $K - 1$ 个类别分别构建 $K - 1$ 个二项Logistic回归模型，具体如下所示：
$\begin{aligned} {\log \frac{P\left(Y=1\right)}{P\left(Y=K\right)}=w_{1} \cdot x} \\ {\log \frac{P\left(Y=2\right)}{P\left(Y=K\right)}=w_{2} \cdot x} \\ \vdots \\ {\log \frac{P\left(Y=K-1\right)}{P\left(Y=K\right)}=w_{K-1} \cdot x} \end{aligned}$ 其中， $\in \mathbf{R}^{n+1}, w_{k} \in \mathbf{R}^{n+1}$ ，对上述公式两边同时指数化易得：
$\begin{aligned} P\left(Y=1\right) &=P\left(Y=K\right) \exp^{w_{1} \cdot x} \\ P\left(Y=2\right) &=P\left(Y=K\right) \exp^{w_{2} \cdot x} \\ \vdots \\ P\left(Y=K-1\right) &=P\left(Y=K\right) \exp^{w_{K-1} \cdot x} \end{aligned}$ 由于每个类别的概率加和必须等于1，因此，可以得到多项Logistic回归模型的计算公式：
$\begin{array}{c}{P(Y=k | x)=\frac{\exp \left(w_{k} \cdot x\right)}{1+\sum_{k=1}^{K-1} \exp \left(w_{k} \cdot x\right)}, \quad k=1,2, \cdots, K-1} \\ \\{P(Y=K | x)=\frac{1}{1+\sum_{k=1}^{K-1} \exp \left(w_{k} \cdot x\right)}}\end{array}$

3.Logistic回归模型的python实现

sklearn已经支持Logistic回归模型。具体的代码实现可以参见本人的github项目：

github地址：https://github.com/lch123456/machine-learning

4.总结

最后，讲一下Logistic回归模型的优缺点吧：

Logistic回归模型具有很强的解释性，模型简单；
Logistic由于是对数线性函数，因此，模型仅限于线性的场合，对于非线性场合可能拟合效果比较差，不过可以通过对连续型变量进行分箱操作，转化为虚拟变量，这样可以进一步提高模型的非线性能力。

林ch

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
Logistic回归模型介绍与python实现

1. 引言对于回归问题，我们知道可以通过回归模型进行拟合，并挖掘各个特征变量对模板变量的影响机制，但是，对于分类问题，由于目标变量是离散型变量，因此，不能直接应用回归模型进行解决，这时，可以使用Logistic回归模型进行解决。2. Logistic回归模型介绍2.1 Logistic回归模型的介绍首先介绍Logistic分布，假设XXX是连续随机变量，XXX服从Logis...
复制链接

扫一扫

专栏目录