逻辑回归（LR）总结

最新推荐文章于 2024-05-19 14:00:00 发布

安小兴先生

最新推荐文章于 2024-05-19 14:00:00 发布

阅读量116

点赞数

分类专栏：人工智能文章标签：逻辑回归机器学习

本文链接：https://blog.csdn.net/junxing2018_wu/article/details/117520184

版权

人工智能专栏收录该内容

6 篇文章 0 订阅

订阅专栏

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。
本文链接：https://blog.csdn.net/junxing2018_wu/article/details/117520184

逻辑回归（logistic regression）

性质

针对二分类问题
基于条件概率出发
线性回归函数（ $y=w^Tx+b$ 和逻辑函数（ $y=\frac {1} {1+e^{-x}}$ ）组合
是线性分类器（决策边界决定了LR是线性分类器）

计算过程

对于二分类问题
$\frac {1} {1+e^{-(w^Tx+b)}} \\ p(y=0| x, w) = \frac {e^{-(w^Tx+b)}} {1+e^{-(w^Tx+b)}}$
可以合并成：
$p(y| x, w,b) = p(y=1| x, w,b) ^y [(1 - p(y=1| x, w,b) )]^{1-y}$
目标函数（objective function）
假设我们拥有数据集 $D={(x_i, y_i)}_{i=1}^{n}$ ， $x_i \in R^d$ ， $y_i \in \{0, 1\}$
此时我们需要最大化目标函数（最大似然估计MLE）：
$\hat w_{MLE}, \hat b_{MLE} =argmax_{w, b} \prod_{i=1}^{n} p( y_ {i} |x_ {i} ,w,b) \\ = argmax_{w,b} \sum_{i=1}^{n} log(p( y_ {i} |x_ {i} ,w,b)) \\ = argmin_{w,b} -\sum_{i=1}^{n} log(p( y_ {i} |x_ {i} ,w,b)) \\ = argmin_{w,b} -\sum_{i=1}^{n} log(p(y_{i}=1| x, w,b) ^{y_{i}} [(1 - p(y_{i}=1| x, w,b) )]^{1-y_{i}}) \\ = argmin_{w,b} -(\sum_{i=1}^{n} y_{i} \cdot log(p(y_{i}=1| x, w,b))+(1-y_{i}) \cdot log(1 - p(y_{i}=1| x, w,b))) \\ = argmin_{w,b} -( \sum_{i=1}^{n} y_{i} \cdot log(\sigma(w^Tx+b)) +(1-y_{i}) \cdot log(1 - \sigma(w^Tx+b)))$
记 $\sum_{i=1}^{n} y_{i} \cdot log(\sigma(w^Tx+b)) +(1-y_{i}) \cdot log(1 - \sigma(w^Tx+b)))$ ，
则 $\frac {\partial L(w,b)}{ \partial w} = -(\sum_{i=1}^{n} y_{i} \cdot \frac {\sigma(w^Tx + b) \cdot [1-\sigma(w^Tx + b) ]}{\sigma(w^Tx + b)} \cdot x_{i}+(1-y_i) \cdot \frac {-\sigma(w^Tx + b) \cdot [1-\sigma(w^Tx + b)]} {1- \sigma(w^Tx + b)} \cdot x_i) \\ = -\sum_{i=1}^{n} y_{i} \cdot (1-\sigma(w^Tx + b)) \cdot x_i + (y-1) \cdot \sigma(w^Tx + b) \cdot x_i) \\ = -\sum_{i=1}^{n} [y_{i} - \sigma(w^Tx + b)] \cdot x_i \\ = \sum_{i=1}^{n} [\sigma(w^Tx + b) - y_{i}] \cdot x_i$
$\frac {\partial L(w,b)}{ \partial b} = -(\sum_{i=1}^{n} y_{i} \cdot \frac {\sigma(w^Tx + b) \cdot [1-\sigma(w^Tx + b) ]}{\sigma(w^Tx + b)} +(1-y_i) \cdot \frac {-\sigma(w^Tx + b) \cdot [1-\sigma(w^Tx + b)]} {1- \sigma(w^Tx + b)}) \\ = -\sum_{i=1}^{n} y_{i} \cdot (1-\sigma(w^Tx + b)) + (y-1) \cdot \sigma(w^Tx + b)) \\ = -\sum_{i=1}^{n} [y_{i} - \sigma(w^Tx + b)] \\ = \sum_{i=1}^{n} [\sigma(w^Tx + b) - y_{i}]$
注释：
1. ${\sigma(x)}' = \sigma(x)(1-\sigma(x))$
2. 最后那个表达式中， $\sigma(w^Tx + b)$ 是预测值， $y_i$ 是真实值，所以这就意味着我们在梯度下降法的时候会不断地去观测当前样本的预测值和真实值，考虑它们之间的差别，然后通过这样的差别不断地更新 $W$ ，使得最后学出一个很好的 $w$ 和 $b$ ，相当于预测值和真实值会不断接近。
3. 注意，当给定的数据线性可分的时候，逻辑回归的参数有可能趋向于正无穷大。（过拟合现象，需要加上正则项）
梯度下降法
1. 初始化 $w^0$ ， $b^0$
2. 设置 epoch num： $m$ ，learning rate： $\eta$
3. t 从 0开始迭代到m，
  $w^{t+1} = w^{t} - \eta \cdot \sum_{i=1}^{n} [\sigma(w^Tx + b) - y_{i}] \cdot x_i$
  $b^{t+1} = b^{t} - \eta \cdot \sum_{i=1}^{n} [\sigma(w^Tx + b) - y_{i}]$
4. 停止条件：
  - $\left | L_t(w,b) - L_{t+1}(w,b) \right | < \epsilon$
  - $\left | w^{t} - w^{t-1} \right| < \epsilon$
  - validation data(early stop)
  - fixed iteration(最大迭代次数)

安小兴先生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归（LR）总结

逻辑回归（logistic regression）性质针对二分类问题基于条件概率出发线性回归函数（y=wTx+by=w^Tx+by=wTx+b 和逻辑函数（y=11+e−xy=\frac {1} {1+e^{-x}}y=1+e−x1）组合是线性分类器（决策边界决定了LR是线性分类器）计算过程对于二分类问题p(y=1∣x,w)=11+e−(wTx+b)p(y=0∣x,w)=e−(wTx+b)1+e−(wTx+b)p(y=1| x, w) = \frac {1} {1+e^{-(w
复制链接

扫一扫

专栏目录