全网最清楚的---逻辑回归（Logistic Regression）

AI_dataloads

已于 2023-09-10 22:28:27 修改

阅读量5.6k

点赞数 8

文章标签：逻辑回归算法机器学习

于 2023-09-10 22:06:50 首次发布

本文链接：https://blog.csdn.net/AI_dataloads/article/details/132795460

版权

一、什么是逻辑回归？

1.个人理解

逻辑回归也称作logistic回归分析，是一种广义的线性回归分析模型，属于机器学习中的监督学习。其推导过程与计算方式类似于回归的过程，但实际上主要是用来解决二分类问题（也可以解决多分类问题）。通过给定的n组数据（训练集）来训练模型，并在训练结束后对给定的一组或多组数据（测试集）进行分类。其中每一组数据都是由p 个指标构成。

2.逻辑回归所处理的数据

逻辑回归是用来进行分类的，下面我将给出一个简单的例子来解释。

我们给出一个人的 [身高，体重] 这两个指标，然后判断这个人是属于”胖“还是”瘦“这一类。对于这个问题，我们可以先测量n个人的身高、体重以及对应的指标”胖“,"瘦”，把胖和瘦分别用0和1来表示，把这n组数据输入模型进行训练。训练之后再把待分类的一个人的身高、体重输入模型中，看这个人是属于“胖”还是“瘦”
如果数据是有两个指标，可以用平面的点来表示数据，其中一个指标为x轴，另一个为y轴；如果数据有三个指标，可以用空间中的点表示数据；如果是p维的话(p>3)，就是p维空间中的点

2.1.引入sigomd函数

sigomd函数的作用：（Sigmoid 函数，也称为 Logistic 函数，是一个常用的激活函数，用于将输入映射到一个取值范围在0和1之间的输出。）

映射到概率值：逻辑回归的目标是预测样本属于某个类别的概率。通过 Sigmoid 函数，将线性回归模型的输出映射到0和1之间的概率值，方便进行分类判断。
可解释性：Sigmoid 函数的输出在0和1之间，可以被解释为样本属于某个类别的概率。例如，输出为0.8表示属于某个类别的概率为80%，输出为0.3表示属于该类别的概率为30%。
阈值确定：根据 Sigmoid 函数的输出概率，我们可以设定一个阈值（通常是0.5），将概率大于等于阈值的样本划分为一个类别，概率小于阈值的样本划分为另一个类别。
平滑性：Sigmoid 函数的输出具有平滑性质，梯度变化较为连续，有利于使用梯度下降等优化算法对模型参数进行更新和优化。

2.2.sigmoid函数公式

$g(z) = \frac{1}{1+e^{-z}}$

2.3.sigmoid函数图像

本质：将线性回归的结果映射到[0,1]区间上，实质上就是完成了二分类任务。

特点：

自变量为负无穷到正无穷
值域为[0,1]

3.引入梯度下降法

3.1.目的

梯度下降法在逻辑回归中起到了优化模型参数、寻找最优解、调节学习率和处理大规模数据的作用。它是逻辑回归模型中常用的优化算法之一，能够有效地提升模型的性能.

3.2梯度下降法的数学推导

详细内容点击可见（梯度下降法）

二、代码实现

1.目标

使用逻辑回归算法对鸢尾花数据集进行分类，并用散点图可视化了分类结果

2.代码文件获取

点击可下载使用：

鸢尾花训练数据.xlsx 鸢尾花测试数据.xlsx