逻辑回归（Logistic Regression)详解

Mr终游

于 2024-05-31 09:00:00 发布

阅读量1.9k

点赞数 46

分类专栏：机器学习文章标签：逻辑回归算法机器学习

本文链接：https://blog.csdn.net/m0_73426548/article/details/139335071

版权

机器学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

一.广义线性回归到逻辑回归

1.什么是逻辑回归

首先逻辑回归并不是一个回归算法，而是一个分类算法，因为逻辑回归是基于多元线性回归算法的，所以逻辑回归是一个线性的分类算法。比如有一堆点，这些点有很多种颜色，我们要用线将这线点划分开，尽量一种颜色一个区域

2.学习之前我们要线了解一个函数：Sigmoid函数：

Sigmoid函数有一个非常好的特性，它的导数可以用自身来表示：

它的函数图像：

逻辑回归的原理就是将多元线性回归的结果缩放到（0，1）之间，比如我们将0.5视为一个分类点，那么就可以将结果分为两类（0，0.5）和（0.5，1）.那么要怎么缩放呢？

同理，我们将0.2，0.4，0.6，0.8看作分类点，那么就可以把数据分为五类了

2.逻辑回归公式推导：

1.损失函数推导

首先是二分类，这里用概率论的伯努利分布（Bernoulli）0-1分布引入一下：

然后我们再使用最大似然估计思想：最大似然估计就是当我们样本有很多的时候，比如一百个球，不知道有多少个白球和黑球，但是我们放回的抽取了一百次，其中有70次白球，30次黑球，我们就可以估计白球的概率为0.7，黑球的概率为0.3。这种方法就叫最大似然估计。

那么我们这里的0和1就像白球和黑球，每次摸到的球可以用伯努利计算，那么它的每次摸球的概率相乘就是它的损失函数了。根据伯努利分布得到，也就是 $h\vartheta (x)$ 就是抓到1的概率，1-它就是0的概率，下面那个方程当抓到1时后面哪项就为0，反正就是抓到0的概率

通过最大似然估计思想后化简就得到了逻辑回归的损失函数了

3.逻辑回归梯度下降

1.函数特性：

逻辑回归的下降规则和线性回归的一样，梯度下降不太清楚的可以去看看梯度下降算法推导

和梯度下降算法优化，套索回归，岭回归

将逻辑回归的损失函数带入梯度那么：下一步=当前+梯度

前面推的逻辑回归函数：

我们将逻辑回归的损失函数求导：

其实最后得到的这个导函数形式和多元线性回归一样，将其导入到梯度下降公式后就得到逻辑回归梯度下降公式了，这个是用来对参数更新的，一步步的走到极值，也就是一步步走到最优解

4.逻辑回归的多分类问题：

我们上面说的主要是二分类问题，那么多分类呢，就是分类白球，黑球，红球，绿球呢

根据我们上面所说的将0.5作为分类点，那么0.2，0.4，0.6，0.8的呢，其实也可以看着二分类问题，我们可以将（0.8，1）的看着一类分类好以后再将（0.6，1）的看着一类以此类推，五次二分类后就将他们分类好了。

这种方法称为One-Vs-Rest，作为一个二分类的扩展方法。优点：普适性还比较广，可以应用于能输出值或者概率的分类器，同时效率相对较好，有多少个类别就训练多少个分类器。缺点：很容易造成训练集样本数量的不平衡（Unbalance），尤其在类别较多的情况下，经常容易出现正类样本的数量远远不及负类样本的数量，这样就会造成分类器的偏向性。