LR的原理，损失函数，求解方法

最新推荐文章于 2023-08-02 16:13:31 发布

zhangkkit

最新推荐文章于 2023-08-02 16:13:31 发布

阅读量614

点赞数

分类专栏：人工智能机器学习文章标签：机器学习

本文链接：https://blog.csdn.net/zhangkkit/article/details/106153710

版权

人工智能同时被 2 个专栏收录

6 篇文章 1 订阅

订阅专栏

机器学习

6 篇文章 0 订阅

订阅专栏

LR的原理，损失函数，求解方法_背诵版

LR的原理
损失函数
求解方法

LR的原理

逻辑回归本质上是线性回归，只是在特征到结果的映射中加入了一层逻辑函数， ${\rm{g}}(z) = \frac{1}{{1 + {e^{ - z}}}}$ ，即：先把特征线性求和 ${\rm{z}} = {w_0} + {w_1}*{x_1} + ..., + {w_n}*{x_n}$ ,然后使用函数g(z)作为假设函数来预测。
逻辑回归用来分类0/1问题，也就是预测结果属于0或者属于1的二值分类问题，有模型：
$g({w^T}x) = \frac{1}{{1 + {e^{ - {w^T}x}}}}$
$g({w^T}x) = \frac{{{e^{ - {w^T}x}}}}{{1 + {e^{ - {w^T}x}}}}$

损失函数

对于训练数据集，特征数据 $x = \{ {x_1},{x_2},...,{x_m}\}$ 和对应的分类标签 ${\rm{y}} = \{ {y_1},...,{y_m}\}$ 。假设m个样本相互独立，那么它们的联合分布为各边缘分布的乘积，得到似然函数：
${\prod\limits_{i = 1}^m {g({w^T}x)} ^{{y_i}}}*{(1 - g({w^T}x))^{1 - {y_i}}}$
取对数：
$\ln L(w) = \sum\limits_{i = 1}^m {{y_i}*\ln g({w^T}x)} + (1 - y)\ln (1 - g({w^T}x))$

求解方法

与线性回归类似，我们使用梯度上升的方法(类似与梯度下降方法)，那么随机梯度上升更新规则为： $\alpha *{\nabla _w}e(w)$

$\begin{array}{l} \frac{\partial }{{\partial {w_j}}}e(w) = \frac{\partial }{{\partial {w_j}}}\{ \sum\limits_{i = 1}^m {\{ {y_i}ln\;g({w^T}{x_i})} + (1 - {y_i})ln\;(1 - g({w^T}{x_i}))\} \\ \;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{\partial }{{\partial {w_j}}}\sum\limits_{i = 1}^m {[\frac{{{y_i}}}{{g({w^T}{x_i})}} - \frac{{1 - {y_i}}}{{1 - g({w^T}{x_i})}}]g({w^T}{x_i})'} \\ \;\;\;\;\;\;\;\;\;\;\;\;\; = \frac{\partial }{{\partial {w_j}}}\sum\limits_{i = 1}^m {[{y_i} - g({w^T}{x_i})]({w^T}{x_i})'} \\ \;\;\;\;\;\;\;\;\;\;\;\;\; = \sum\limits_{i = 1}^m {[{y_i} - g({w^T}{x_i})]{w_j}} \end{array}$