挖掘原理|逻辑斯蒂回归原理

尘落心上

已于 2022-09-19 00:05:36 修改

阅读量323

点赞数

文章标签：人工智能回归算法机器学习 python

于 2022-09-04 20:04:20 首次发布

本文链接：https://blog.csdn.net/qq_43497781/article/details/126689317

版权

本文形象地解释了逻辑斯蒂回归的工作原理，通过实例展示了如何利用线性计算和sigmoid函数来确定样本点属于某一类别的概率。讨论了逻辑斯蒂回归中的概率计算函数以及参数优化方法，包括最大似然估计和优化算法的应用。

摘要由CSDN通过智能技术生成

形象理解逻辑斯蒂回归

在k邻近算法中，因为同一类的样本点总是表现出彼此之间距离相近，所以我们可以通过计算样本点之间的距离进行分类，那么换一个角度来思考，预测样本点所属类别也就是要判断这个样本点属于哪个类别的概率最大，即对于给定的特征向量 $\boldsymbol{X}$ 求其属于某一类别的概率 $P(Y=i\mid \boldsymbol{X})$ ，预测其分类，也就是逻辑斯蒂回归（LogisticRegression）。

或者我们可以更形象的理解，属于同一类别的样本点的分布是相近的，那么将其映射到某条曲线上的分布也应该是相近的，而我们学习的目的就是为了获取能够使映射之后的样本点同类别分布尽可能相近，不同类别之间尽可能远的这样一组参数。

我们以下面数据为例直观感受一下逻辑斯蒂回归
在这里插入图片描述
首先我们看数据的前三列，x1，x2表示两个特征，y表示所属类别，我们大致可以感受到相同类别的样本点之间分布应该很近，不妨看一下下面的图，更加直观。

黄色代表 $y = 1$ 的类，紫色代表 $y = 0$ 的类，这些样本点之间分布确实很明显的能分出类别.

再看数据表中的wx和p的值，这两列是经过逻辑斯蒂回归优化后得出的，对x1和x2进行线性计算之后的值，以及最终得出的 $P(Y=i\mid \boldsymbol{X})，i\in \{0,1\}$ ，可以看出经过线性计算的得出的值，属于类别1的值大概都是5.5左右，而属于类别0的值大概都是-2.5左右，概率也有着相近的特点，类别1的概率都是接近1，类别0都是接近0，再下图更能直观的表示这一点。
在这里插入图片描述