逻辑斯蒂回归（LR）原理详解及公式推导

woniuhuli

于 2018-03-24 18:28:46 发布

阅读量9.8k

点赞数 5

分类专栏：机器学习算法文章标签：机器学习算法原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woniuhuli/article/details/79680408

版权

逻辑斯蒂回归（LR）是一种对数线性模型，用于预测事件发生的概率。它通过线性函数计算对数几率，并通过最小化损失函数或最大化对数似然来进行参数优化。损失函数通常采用交叉熵，训练过程可以使用梯度下降法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

说白了，逻辑斯蒂回归实际上就是label y = 1的对数几率是输入x的线性函数的模型。

对数几率
一个事件发生的概率为 $P$ , 则该事件发生的几率为 $\frac{P}{1-P}$ , 即为该事件发生的概率除以该事件不发生的概率。
该事件的对数几率即为：
$l o g i t (p) = l o g p 1 - p$ $logit(p) = log\frac{p}{1-p}$
逻辑斯蒂回归模型
事件 $y = 1$ 的对数几率为输入 $x$ 的线性函数，即
$l o g \frac{P (y = 1 | x)}{1 - P (y = 1 | x)} = ω x + b (１)$ $log\frac{P(y=1|x)}{1-P(y=1|x)} =\omega x+b 　　　　　　(１)$
上述模型即为逻辑斯蒂回归模型，因此逻辑斯蒂回归是一种对数线性模型（PS：有可能数据集实际上是线性不可分的，这时候若要用逻辑斯蒂回归，可引入核函数，利用核技巧来实现（PPS：核技巧会在后续SVM算法中提到），利用核函数可以将线性不可分数据集映射到高维空间，在高维空间中，数据集变为线性可分的了）。通过定义合理的损失函数（下文会分析推导），学习得到 $\omega ,b$ 的最优值。对于一个新的未知样本 $x$ ，代入即可得到 $P (y = 1 | x)$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。