机器学习-逻辑回归

最新推荐文章于 2022-05-31 17:36:10 发布

路灯捶背三百一位

最新推荐文章于 2022-05-31 17:36:10 发布

阅读量391

点赞数

分类专栏：逻辑回归文章标签：机器学习

本文链接：https://blog.csdn.net/u010473886/article/details/103394946

版权

逻辑回归专栏收录该内容

2 篇文章 0 订阅

订阅专栏

逻辑回归的损失函数

逻辑回归

逻辑回归

什么是逻辑回归

逻辑回归（Logistic Regression）是一个用来解决分类问题的算法，逻辑回归算法可以根据样本的特征计算出样本发生的概率，概率取值范围 [0, 1]之间，是一个浮点数，一个精确到数值，算法名称中包含“回归”两个字眼；
在多元线性回归，多项式回归模型中
$y = f (x)$
我们训练处模型后，传入样本x,输出的预测值y值域是 (-infinite, +infinite) ，但是逻辑回归我们需要的输出是一个0-1之间的概率，如果输出值大于0.5 则分类为1，小于0.5则分类为0；所以我们需要一个函数，将 $\theta \cdot X$ 输出的y 映射到 [0, 1]之间

sigmoid函数

$\frac {1} {1+e^{-t}}$
函数姿势是这样的
在这里插入图片描述
t值就是我们传入的预测值 y, 可以想象一下，如果t 趋于正无穷，则 $e^{-t}$ 值趋于0，那么 sigmoid函数值趋于1，反之 t趋于负无穷，则sigmoid 函数值趋于0；当t = 0，函数值为0.5 ；这个函数用来将一个值域为 (-infinite, +infinite)的值映射到 (0,1)之间

逻辑回归的损失函数

应用sigmoid函数后，那么对于样本 $x_1$ 预测输出值为
$\frac {1} {1 + e^{-X_b^1 \cdot \theta}}$

我们再来考虑逻辑回归的损失函数，逻辑回归的损失函数与之前多元线性回归，PCA 的损失函数不同，当样本的标记不同（为0 或 1）逻辑回归的损失函数也不一样；
对于一个样本 $x_b$
如果 $x_b$ 的标记为1：预测值 p（取值范围[0, 1]）越大则误差越小（趋于0）
如果 $x_b$ 的标记为0：预测值 p（取值范围[0, 1]）越大则误差越大（趋于正无穷）
所以我们使用如下函数作为逻辑回归的损失函数
当 $x_b$ 标记为1：
$c o s t = - l o g (p)$
当 $x_b$ 标记为0：
$c o s t = - l o g (1 - p)$

函数图像如下
在这里插入图片描述
可以看出罗辑回归的损失函数分为两段，样本的标记不同，则需要应用不用的损失函数，我们使用下面的方式，将损失函数的两部分合为一体

$\cdot -log(_p^\verb!^!) + (1-y) \cdot (-log(1-{_p^\verb!^!}))$
当样本的 y 分类为1 ，代入公式，就会忽略 y为0 的部分；而y分类为0时就会忽略 y为1 的损失函数部分，那么这就是逻辑回归的损失函数

逻辑回归损失函数求导

由于 $\sigma(-X_b \cdot \theta) = (\frac {1} {1+e^{-X_b \cdot \theta}})$
代入损失函数中,并考虑所有样本
$\sum_{i=1}^{m} (y^i) \cdot (-log({\frac 1 {1 + e^{-X_b^i \cdot \theta}}})) + (1-y^i) \cdot (-log(1- {\frac 1 {1 + e^{-X_b^i \cdot \theta}}}))$
对 $\theta$ 各个维度分量求导，得到梯度，然后进行梯度下降即可
为了计算方便，我们先对 $\sigma$ 函数外面的部分进行求导
$\sum_{i=1}^{m} (y^i) \cdot (-log({\sigma(p)})) + (1-y^i) \cdot (-log(1- {\sigma(p)}))$
化简
$-\sum_{i=1}^{m} y^i \cdot (log({\sigma(p)})) + (1-y^i) \cdot (log(1- {\sigma(p)}))$