为什么平方损失函数不适用于分类问题?

损失函数的定义

损失函数是一个非负实数,用来量化模型预测和真实标签之间的差异。我们一般会用损失函数来进行参数的优化,当构建了不连续离散导数为0的函数时,这对模型不能很好地评估。

平方损失函数(Quadratic Loss Function)

平方损失函数经常用在预测标签 y y y为实数值的任务中,定义为: L ( y , f ( x ; θ ) ) = 1 2 ( y − f ( x ; θ ) ) 2 \mathcal{L}\left( y,f\left( \mathbf{x;}\theta \right) \right) =\frac{1}{2}\left( y-f\left( \mathbf{x;}\theta \right) \right) ^2 L(y,f(x;θ))=21(yf(x;θ))2
平方损失函数一般不适用于分类问题。

平方损失函数为啥不适用于分类问题??

首先我们要明确分类问题的概念:在二分类问题中 y = { + 1 , − 1 } y=\left\{ +1,-1 \right\} y={+1,1} C C C分类问题中 y = { 1 , 2 , 3 , ⋅ ⋅ ⋅ , C } y=\left\{ 1,2,3,···,C \right\} y={1,2,3C}。可以看出分类问题输出的结果为离散的值。
这里我在邱锡鹏老师的问题讨论区
看到一则评论为:分类问题中的标签,是没有连续的概念的。每个标签之间的距离也是没有实际意义的,所以预测值和标签两个向量之间的平方差这个值不能反应分类这个问题的优化程度。比如分类 1,2,3, 真实分类是1, 而被分类到2和3错误程度应该是一样的,但是明显当我们预测到2的时候是损失函数的值为1/2而预测到3的时候损失函数为2,这里再相同的结果下却给出了不同的值,这对我们优化参数产生了误导。
至于分类问题我们一般采取交叉熵损失函数(Cross-Entropy Loss Function)来进行评估。

  • 8
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值