Logistic regression为什么不用Square error做loss function?

最新推荐文章于 2024-01-09 11:59:25 发布

Un_Freaking_MAN

最新推荐文章于 2024-01-09 11:59:25 发布

阅读量2.1k

点赞数 4

文章标签：损失函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Un_Freaking_MAN/article/details/77725967

版权

假设训练样本为 $(x_i,y_i),f(x_i)=\frac{1}{1+exp(-(wx+b))}$
采用类似Linear regression的损失函数Square error: $\frac{1}{2}\sum_{i=1}^n l(f(x_i)-y_i)^2$
那么令其对 $w$ 求导，得到以下

1 2 \sum i = 1 n \partial l ( f ( x i ) - y i ) \partial w = 1 2 \sum i = 1 n 2 l (f (x i) - y i) \partial f ( x i ) \partial w = 1 2 \sum i = 1 n 2 l (f (x i) - y i) \partial f ( x i ) \partial z \partial z \partial w = 1 2 \sum i = 1 n 2 l (f (x i) - y i) f (x i) (1 - f (x i)) x i

$\frac{1}{2}\sum_{i=1}^n\frac{\partial l(f(x_i)-y_i)}{\partial w} =\frac{1}{2}\sum_{i=1}^n 2l(f(x_i)-y_i)\frac{\partial f(x_i)}{\partial w}= \frac{1}{2}\sum_{i=1}^n 2l(f(x_i)-y_i)\frac{\partial f(x_i)}{\partial z}\frac{\partial z}{\partial w}=\frac{1}{2}\sum_{i=1}^n 2l(f(x_i)-y_i)f(x_i)(1-f(x_i))x_i$

所以，

$y_i=0$ 时，若 $f(x_i)=0$ ，则上式为0，符合loss；若 $f(x_i)=1$ ，则上式也为0，不符合loss；
$y_i=1$ 时，若 $f(x_i)=1$ ，则上式为0，符合loss；若 $f(x_i)=0$ ，则上式也为0，不符合loss；

再看看用suqare error和cross entropy做loss function的loss surface (图片来自台大李宏毅老师课件)
这里写图片描述

Un_Freaking_MAN

关注

4
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Logistic regression为什么不用Square error做loss function?

Logistic regression为什么不用Square error做loss function?
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。