通俗理解逻辑回归

闹闹的BaBa

已于 2023-03-25 21:15:18 修改

阅读量2.5k

点赞数 6

分类专栏：机器学习文章标签：逻辑回归逻辑回归原理逻辑回归推导通俗理解逻辑回归 LR

于 2019-04-09 15:08:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012415035/article/details/89139649

版权

机器学习专栏收录该内容

23 篇文章

订阅专栏

前言

关于机器学习相关的算法，不想追求高大上，只想用通俗易懂的方式去推导。一是因为能力有限；二是因为只注重公式推导和严谨性对于初学者来说不好理解。欢迎大佬们多多指教。

☆☆☆ 算法目录导航页，包含基础算法、高级算法、机器学习算法等☆☆☆

1. ML/DL到底要干什么

其实整个机器学习或深度学习要干的事只有2件：

① Data → Model，已知数据，如何建模；

② Model → 求参数，已知model，如何求参数w。

2. 逻辑回归概念

逻辑回归（logistic regression）是机器学习模型中的基础模型。虽然叫回归，实际却是解决分类问题。究其原因，是历史遗留问题，大家不要纠结这个，只要记住是解决分类问题就可以了。（葫芦书有详细说明，有兴趣可以看看）

3. 如何建模

逻辑回归是一个广义的线性模型，我的理解它的初衷是想用线性函数去解决分类问题。比如，用 y = wx 解决分类，但是y的值是连续的，不是0,1。那么我们希望找到一个阶跃函数能把y的值映射成0,1，所以阶跃函数h如下： $h(y)=\left\{\begin{array}{cl}{0,} & {y<0} \\ {0.5,} & {y=0} \\ {1,} & {y>0}\end{array}\right.$

但是，上式不连续，我们希望找到一个单调可微函数，以便我们后面求解参数。所以，我们找到了一个Sigmoid函数: $h(y)=\frac{1}{1+e^{-y}}$

它的函数图像是这样的：

在这里插入图片描述

因此，用sigmoid函数代替了之前的阶跃函数。

sigmoid函数表示的是给定x, y趋近于0和1时的概率值，则我们可以表示为后验概率：

$p_{1} = P(y=1|x;w) =h(x)$

$p_{0} = P(y=0|x;w) =1-h(x)$

则目标函数可表示为： $p_{1}^{y} \cdot p_{0}^{1-y}$

4. 如何求参数

① 找一个损失函数；

② 利用梯度下降算法优化损失并求出参数。

利用最大似然估计MLE化简目标函数。为什么用MLE呢？

1.最大似然也就是最大概率，概率越大即分类更精确，求出概率最大时w的值即可。

2.得到的损失函数是凸函数，利于求解。

所以，使用MLE是合理的。

MLE 化简： $\begin{aligned} L(w) &=\max P(y | x ; w) \\ &=\max \prod_{i=1}^{n} p\left(y^{(i)} | x^{(i)} ; w\right) \\ &=\max \prod_{i=1}^{n}p_{1}^{y^{(i)}}\ p_{0}^{1-y^{(i)}} \\ &=\max \prod_{i=1}^{n}\left(h\left(x^{(i)}\right)\right)^{y^{(i)}}\left(1-h\left(x^{(i)}\right)\right)^{1-y^{(i)}} \end{aligned}$

为了简化运算，L(w)取对数：

$\ l(w)=ln L(w)=max\ \sum_{i=1}^{n}\left[ y^{(i)} \ln h\left(x^{(i)}\right)+\left(1-y^{(i)}\right)ln\left(1-h\left(x^{(i)}\right)\right)\right]$

求l(w)最大，也就是求-l(w)最小，那我们就可以定义损失函数为 -l(w)，则损失函数为： $\ J(w)= -\frac{1}{n}\sum_{i=1}^{n} \left[y^{(i)} \ln h\left(x^{(i)}\right)+\left(1-y^{(i)}\right)ln\left(1-h\left(x^{(i)}\right)\right)\right]$

它的函数图像是这样的：

在这里插入图片描述

它是一个单调凸函数，所以我们用梯度下降算法求参数w。梯度下降算法公式：

$w_{j} :=w_{j}-\alpha \frac{\partial J(w_{j})}{\partial w_{j}}$

α 为学习率。我们按照公式不断更新w的时候，损失函数的值会逐渐下降，当其慢慢下降到最小值附近开始收敛以后，我们就得到了训练好的【逻辑回归预测模型】。

5.总结

① 我们从线性函数的角度入手；

② 为了能让线性函数表示成分类，得到了阶跃函数；

③ 为了能使用梯度下降优化算法求解w，我们找到了单调可微的sigmoid函数代替阶跃函数。

④ 为了求解方便，我们用最大似然估计简化了目标函数，得到对数似然函数，顺便定义了损失函数；

⑤ 最后使用gradient descent 不断更新w得到损失函数最小时模型的样子：逻辑回归预测模型(trained)。

博客等级

码龄12年

100
原创

180
点赞

860
收藏

2371
粉丝

关注

私信

分类专栏

展开全部收起

最新评论

自然语言处理（NLP）算法分类总结
CSDN-Ada助手: 什么是自然语言处理？
impala日期函数全集
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)文章不宜太短；(2)增加除了各种控件外，文章正文的字数；(3)增加条理清晰的目录。
通俗理解逻辑回归
CSDN-Ada助手: 很多人说算法库都是现成的，没必要掌握算法了，你怎么看呢？
top命令输出解释以及load average 详解及排查思路
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)使用更多的站内链接；(3)增加条理清晰的目录。
大数据平台搭建（二）：hadoop HA 集群搭建
CSDN-Ada助手: Apache Arrow 这种列式内存格式，它的优势是什么？

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。