逻辑回归（logistic regression）原理详解

最新推荐文章于 2025-07-21 04:53:48 发布

原创

最新推荐文章于 2025-07-21 04:53:48 发布 · 10w+ 阅读

400 ·

CC 4.0 BY-SA版权

文章标签：

#逻辑回归 #logistic regression #最大似然估计 #分类

逻辑回归是一种结合回归分析与分类的机器学习算法。它使用Sigmoid函数将连续值转化为0-1之间的概率，从而解决二分类问题。通过最大化似然估计找到最佳参数，并利用梯度下降法优化代价函数。

机器学习解决的问题，大体上就是两种：数值预测和分类。前者一般采用的是回归模型，比如最常用的线性回归；后者的方法则五花八门，决策树，kNN，支持向量机，朴素贝叶斯等等模型都是用来解决分类问题的。其实，两种问题从本质上讲是一样的：都是通过对已有数据的学习，构建模型，然后对未知的数据进行预测，若是连续的数值预测就是回归问题，若是离散的类标号预测，就是分类问题。

这里面有一类比较特殊的算法，就是逻辑回归（logistic regression）。它叫“回归”，可见基本思路还是回归的那一套，同时，逻辑回归又是标准的解决分类问题的模型。换句话说，逻辑回归是用与回归类似的思路解决了分类问题。

1. 阶跃函数

现在有 $n$ 个数据元组 $\{X_1, X_2, \dots, X_n\}$ ，每个数据元组对应了一个类标号 $y_i$ ，同时每个数据元组 $X_i$ 有 $m$ 个属性 $\{x_{i1}, x_{i2}, \dots, x_{im}\}$ 。假设现在面临的是一个简单的二分类问题，类标号有0，1两种。如果用简单的回归方法对已知数据进行曲线拟合的话，我们会得到如下的曲线方程（曲线拟合的方法后面会说到）：

z = f (X) = w 0 + w 1 x 1 + w 2 x 2 + \dots + w m x m (1)

$\begin{equation} z = f(X) = w_0 + w_1x_1 + w_2x_2 + \dots + w_mx_m \end{equation}$

注：并不是说逻辑回归只能解决二分类问题，但是用到多分类时，算法并没有发生变化，只是用的次数更多了而已。

实际上，逻辑回归分类的办法与SVM是一致的，都是在空间中找到曲线，将数据点按相对曲线的位置，分成上下两类。也就是说，对于任意测试元组 $X^*$ ， $f(X^*)$ 可以根据其正负性而得到类标号。那换句话说，直接依靠拟合曲线的函数值是不能得到类标号的，还需要一种理想的“阶跃函数”，将函数值按照正负性分别映射为0，1类标号。这样的阶跃函数 $\phi(z)$ 如下表示：