详解逻辑回归Logistic Regression

最新推荐文章于 2022-04-05 12:04:40 发布

Avery123123

最新推荐文章于 2022-04-05 12:04:40 发布

阅读量1.5k

点赞数

分类专栏：机器学习文章标签：详解逻辑回归Logistic Regression

本文链接：https://blog.csdn.net/Avery123123/article/details/102826272

版权

机器学习专栏收录该内容

12 篇文章 3 订阅

订阅专栏

详解逻辑回归Logistic Regression

什么是回归

简单来说，回归就是根据输入预测一个值。

从线性回归到Logistic回归

线性回归模型是求出输出变量 Y 和输入特征变量 X 之间的线性关系系数 θ，使其满足 Y = Xθ ，这里的 Y是连续型的，如果想要使 Y 是离散型的（分类变量），那么就需要对 Y 进行一次函数变换（映射 : g），得到的 g(Y)，使得当 g(Y) 值在某个实数区间时样本的输出值为一类别，而当在另一个实数区间时对应样本的输出值为另一类别，当只有两个类别时，就得到了一个二分类模型，我们就从线性模型过度到了Logistic回归模型。

由线性回归模型引出Logistic回归分类模型示意图：
在这里插入图片描述

什么是逻辑回归

简单来讲，逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法，运用梯度下降来求解参数，来达到将数据二分类的目的。

包含了5个点 1：逻辑回归的假设，2：逻辑回归的损失函数，3：逻辑回归的求解方法，4：逻辑回归的目的，5:逻辑回归如何分类。

逻辑回归假设

在这里插入图片描述

logistic函数

在这里插入图片描述

logistic函数求导

在这里插入图片描述

逻辑回归的损失函数

对数损失函数与平方损失函数

在逻辑回归的推导中，我们假设样本是服从伯努利分布(0-1分布)的，然后求得满足该分布的似然函数，最终求该似然函数的极大值。

整体的思想就是求极大似然函数的思想。而取对数，只是为了方便我们的在求MLE(Maximum Likelihood Estimation)过程中采取的一种数学手段而已。

常见的损失函数

在这里插入图片描述

详解损失函数

在这里插入图片描述

二元Logistic回归模型常规步骤：

在这里插入图片描述

Logistic回归的优缺点：

优点：
（1）速度快，适合二分类问题，不需要缩放输入特征；
（2）简单易理解，模型的可解释性非常好，从特征的权重可以看到不同的特征对最后结果的影响；
（3）易更新模型吸收新数据；
（4）训练速度较快。分类的时候，计算量仅仅只和特征的数目相关；
（5）资源占用小，尤其是内存。因为只需要存储各个维度的特征值。

缺点：
（1）不能用Logistic回归去解决非线性问题，因为Logistic的决策面试线性的；
（2）高度依赖正确的数据表示；
（3）对多重共线性数据较为敏感；
（4）准确率并不是很高。因为形式非常的简单(非常类似线性模型)，很难去拟合数据的真实分布；
（5）很难处理数据不平衡的问题；
（6）逻辑回归本身无法筛选特征。有时候，我们会用gbdt来筛选特征，然后再上逻辑回归。

Logistic回归与线性回归的区别与联系：

在这里插入图片描述

为什么逻辑回归是一个分类算法，但是又叫回归？

在这里插入图片描述

逻辑回归的多标签分类

我们讨论了逻辑回归模型(Logistic Regression)，但是我们发现，逻辑回归模型解决的是二分问题。在现实情境下，我们的训练集往往包含多个类，那我们可不可以把把多分类问题转化为二分类问题呢?答案是肯定的。

多分类问题的基本思想就是，将多分类任务拆解为若干个二分类任务求解。

拆分策略（四种）

一对一拆分（OvO）

基本思想：
将N个类别两两匹配，每次使用2个类别的数据训练分类器，从而产生N(N−1)/2个二分类器。使用时，将样本提交给所有的分类器，得到了N(N−1)/2个结果，最终属于哪个类别通过投票产生。

实例
假设我们要解决一个分类问题，该分类问题有三个类别，分别用△，□和×表示，每个实例（Entity）有两个属性（Attribute），如果把属性 1 作为 X 轴，属性 2 作为 Y 轴，训练集（Training Dataset）的分布可以表示为下图：
在这里插入图片描述
One-Vs-One 是一种相对稳健的扩展方法。对于三分类问题，我们像举行车轮作战一样让不同类别的数据两两组合训练分类器，可以得到 3 个二元分类器。

三角形与 x 训练得出的分类器：
在这里插入图片描述
三角形与正方形训练的出的分类器：

正方形与 x 训练得出的分类器：

假如我们要预测的一个数据在图中红色圆圈的位置，那么第一个分类器会认为它是 x，第二个分类器会认为它偏向三角形，第三个分类器会认为它是 x，经过三个分类器的投票之后，可以预测红色圆圈所代表的数据的类别为 x。
在这里插入图片描述
任何一个测试样本都可以通过分类器的投票选举出预测结果，这就是 One-Vs-One 的运行方式。