Logistic回归的基本原理(简单介绍)

最新推荐文章于 2024-08-24 18:06:30 发布

宅男不宅

最新推荐文章于 2024-08-24 18:06:30 发布

阅读量4.9k

点赞数 2

分类专栏：机器学习算法文章标签：机器学习

本文链接：https://blog.csdn.net/qq_38023849/article/details/111185579

版权

机器学习算法专栏收录该内容

4 篇文章

订阅专栏

本文介绍了Logistic回归（LR回归），它是一种分类器。先阐述了sigmoid函数可将实数域元素映射到(0, 1)区间，对应概率取值。接着说明LR模型可作为二分类器。还给出数据集下LR模型参数w、b的概率解释，通过极大似然估计得到似然函数，用梯度上升法等优化求解。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

LR回归

Logistic 回归是一种分类器，功能与贝叶斯分类器，SVM等分类器一致，是用于分类的，而不是进行数据回归的。下面简单介绍下整个LR模型的基本原理，主要有两个核心问题，1是LR如何分类，2是如何得到模型内相应的参数。
首先介绍sigmoid函数，sigmoid函数可以把任意实数域内的元素映射到 $(0 ， 1)$ 之间。表达式如下：

$y(x)=\frac{1}{1+e^{-x}}\tag{1}$

图像如下：
在这里插入图片描述
值得注意的是， $(0, 1)$ 这个区间正好对应了概率的取值，因此sigmoid函数的函数值在某些情况下就可以看成概率。

LR回归的模型很简单，表达式如下：

$y_i=\frac{1}{1+e^{-w^Tx_i-b}}$

首先 $w^Tx_i+b$ 是一个线性分类器（图像表达为一个超平面），为什么呢？考虑最简单的二维情况：

当数据 $x_i$ 落在直线上时有 $w^Tx_i+b=0$
当数据 $x_i$ 落在直线上方时有 $w^Tx_i+b>0$
当数据 $x_i$ 落在直线下方时有 $w^Tx_i+b<0$

其次 $y_i=\frac{1}{1+e^{-w^Tx_i-b}}$ 也是一个分类器，为什么呢？也考虑二维最简单的情况：
当数据 $x_i$ 落在直线上时有 $y_i=\frac{1}{1+e^{-w^Tx_i-b}}=0.5$
当数据 $x_i$ 落在直线上方时有 $y_i=\frac{1}{1+e^{-w^Tx_i-b}}\in(0.5,1)$
当数据 $x_i$ 落在直线下方时有 $y_i=\frac{1}{1+e^{-w^Tx_i-b}}\in(0,0.5)$