逻辑斯蒂回归(Logistic regression, LR)

最新推荐文章于 2023-08-13 18:46:27 发布

Leon_winter

最新推荐文章于 2023-08-13 18:46:27 发布

阅读量389

点赞数

分类专栏：机器学习文章标签：逻辑斯蒂回归 Logistic regression 机器学习 LR machinelearning

本文链接：https://blog.csdn.net/Leon_winter/article/details/87777098

版权

文章目录@[toc]参考书籍：《统计学习方法》

摘要由CSDN通过智能技术生成

文章目录

逻辑斯蒂回归(Logistic regression, LR)
总结

逻辑斯蒂回归(Logistic regression, LR)

是一个概率模型，判别模型，监督学习模型。虽然名字里带有回归，但却是一个分类模型。

1. LR模型

LR是以逻辑斯蒂函数 $f(x)=\frac{1}{1+e^{-(x-\mu)/\gamma}}$ 为后验概率函数的概率模型，基本思路同朴素贝叶斯类似，都是计算待分类记录是各个类别的概率，取概率最大的类别为最终分类结果，以二分类为例，设 $A$ 是一个类别，计算记录 $x$ 是类别 $A$ 的后验概率： $P(y=A|x)=\frac{1}{1+e^{-wx}}$ ，同时计算记录 $x$ 是另一个类别 $B$ 的后验概率： $P(y=B|x)=1-P(y=A|x)=\frac{e^{-wx}}{1+e^{-wx}}$ 取两者中最大的一个为最终对记录 $x$ 的分类结果。这里记录 $x$ 表示成输入向量 $x=(x^{(1)},x^{(2)}\dots x^{(m)})$ ， $w=(w_{1},w_{2}\dots w_{m})$ 是模型参数。需要强调的是，如果 $P (y = A ∣ x)$ 与 $P (y = B ∣ x)$ 的分母是 $1+e^{-wx+b}$ ，即有一个常数因子 $b$ ，则该常数因子 $b$ 也可以融入模型参数之中，此时输入向量是 $x=\{-1,x^{(1)},x^{(2)}\dots x^{(m)}\}$ ，模型参数是 $w=\{b,w_{1},w_{2}\dots w_{m}\}$ 。

可见，LR学习的主要目的就是确定模型参数 $w$ 。

2. 对数几率函数

在LR中，对数几率函数定义如下

$log(\frac{P(y=A|x)}{1-P(y=A|x)})=wx$

这样处理之后，我们把要计算的函数，从 $~P(y=A|x)=\frac{1}{1+e^{-wx}}~$ 样子的函数，转变成 $~log(\frac{P(y=A|x)}{1-P(y=A|x)})=wx~$ 样子的函数，计算难度下降了很多。
当然，这种变换并不是线性变换，但是对我们研究分类来说，又不失一般性。对 $log(\frac{P(y=A|x)}{1-P(y=A|x)})$ 函数来说， $w x$ 变大，说明 $P (y = A ∣ x)$ 变大， $P (y = B ∣ x)$ 变小（因为 $P (y = A ∣ x) + P (y = B ∣ x) = 1$ ），当 $w x = 1$ ，说明