51-逻辑回归的损失函数

最新推荐文章于 2023-05-01 12:25:44 发布

蓝子娃娃

最新推荐文章于 2023-05-01 12:25:44 发布

阅读量1k

点赞数 2

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41033011/article/details/109173451

版权

机器学习专栏收录该内容

89 篇文章 47 订阅

订阅专栏

逻辑回归的损失函数

上一篇博客我们介绍了逻辑回归的大致框架，通过 $S i g m o i d$ 函数得出了这个式子：

在这里插入图片描述

现在的问题就是我们怎么建模来求出 $θ$ ？逻辑回归和线性回归最大的区别就是逻辑回归解决的是分类问题，所以给出来的数据 $y$ 要么是 1，要么是 0，而我们是根据估计出来的 $p$ 来决定我们估计的 $y$ 到底是 1 还是 0，那么它分成了两类。相应的，我们的损失函数也分成两类（下面的 $y$ 是真值）：

在这里插入图片描述
也就是给定的样本的真值为 1 的话，那么我们估计出来的 $p$ 越小，意味着我们最后得到的 $y$ 的预测值越接近于 0，那么我们的损失就越大。相反同理。‘

那么我们应该使用什么样的函数满足 $c o s t$ 的特征呢？我们使用这样一个式子：

在这里插入图片描述

看起来非常复杂，其实很容易理解。下面我们逐一开始分析，我们先从 $y = 1$ 开始，我们先来看看 $l o g (x)$ 这根曲线是什么样子的：

但是我们的损失函数是 $- l o g (x)$ ，它与 $l o g (x)$ 是关于 $x$ 轴对称的。

在这里插入图片描述

这里需要注意，由于我们传入的 $p$ 的值只在 0-1 之间。

在这里插入图片描述

很容易发现当 $p = 0$ 时， $c o s t$ 值趋近于正无穷，此时损失很大；当 $p = 1$ 时， $c o s t$ 值等于 0，此时没有损失。

下面我们再来看看 $- l o g (1 - x)$ 是什么样子的曲线：

在这里插入图片描述

因为 $p$ 的取值也在 0-1 之间，所以我们只看 0-1 之间的部分。当 $x = 1$ 时， $y$ 无限趋近于 1。

在这里插入图片描述

但是使用这种函数要分情况讨论，这显然是不方便的。那么我们可以通过一个手段将它们合成一个函数：

在这里插入图片描述

通过这样一个式子，我们通过 $p$ 求出了相应的损失是多少。我们会有 $m$ 个样本，我们只需要将 $m$ 个样本的损失加在一起就得到了我们的损失函数 $J (θ)$ 。

在这里插入图片描述

而 $p$ 的计算式子如下：

在这里插入图片描述

那么我们将 $J (θ)$ 中的 $p$ 进行替换，就会得到：

在这里插入图片描述

这样我们就求出了对于逻辑回归来说相应的损失函数。下面我们要做的事情就是找到一组 $θ$ ，使得 $J (θ)$ 尽可能小。

对于 $J (θ)$ ，我们没有一个公式来求解出相应的 $θ$ 的值，我们只能够使用梯度下降法进行求解。

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
51-逻辑回归的损失函数

逻辑回归的损失函数上一篇博客我们介绍了逻辑回归的大致框架，通过 SigmoidSigmoidSigmoid 函数得出了这个式子：现在的问题就是我们怎么建模来求出 θθθ？逻辑回归和线性回归最大的区别就是逻辑回归解决的是分类问题，所以给出来的数据 yyy 要么是 1，要么是 0，而我们是根据估计出来的 ppp 来决定我们估计的 yyy 到底是 1 还是 0，那么它分成了两类。相应的，我们的损失函数也分成两类（下面的 yyy 是真值）：也就是给定的样本的真值为 1 的话，那么我们估计
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。