十大机器学习算法-逻辑回归（LR）

最新推荐文章于 2024-09-08 12:03:05 发布

zjwreal

最新推荐文章于 2024-09-08 12:03:05 发布

阅读量578

点赞数

分类专栏：机器学习文章标签：机器学习 LR

本文链接：https://blog.csdn.net/zjwreal/article/details/89977068

版权

逻辑回归（LR）是一种经典的分类方法，常用于二分类问题。本文介绍了其基本思想，包括模型参数估计的对数似然函数及梯度下降求解过程，并探讨了特征处理、正则化、类别不平衡等问题。此外，还提供了代码实现链接及参考资料。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

简介

逻辑斯蒂回归（logistic regression，LR）是统计学习中经典的分类方法，属于对数线性模型。是目前使用最多的机器学习分类方法，在推荐系统中的应用非常广泛。

基本思想

假定只考虑二分类问题，随机变量X取值为实数，随机变量Y取值为1或0。二项逻辑斯蒂回归模型是如下的条件概率分布：
$\frac{exp(w\cdot x +b)}{1+exp(w\cdot x +b)} \\ P(Y=0|x) = \frac{1}{1+exp(w\cdot x +b)}$
其中 $x\in \mathbb{R}^n$ 是输入， $Y\in \{0,1\}$ 是输出， $w\in \mathbb{R}^n$ 和 $b\in \mathbb{R}$ 是参数。 $w$ 称为权值向量， $b$ 称为偏置， $w\cdot x$ 为 $w$ 和 $b$ 的内积。

逻辑斯蒂回归模型的特点：一个事件的几率（odds）是指该事件发生的概率与该事件不发生的概率的比值。如果事件发生概率是 $p$ ，那么该事件的几率是 $\frac{p}{1-p}$ ，该事件的对数几率或logit函数是 ${\rm logit}(p) = {\rm log}\frac{p}{1-p}$
对LR而言，有
${\rm log} \frac{P(Y=1)}{1-P(Y=1)} = w\cdot x +b$
在逻辑斯蒂回归模型中，输出 $Y = 1$ 的对数几率是输入 $x$ 的线性函数。