机器学习之损失函数学习总结

经验风险最小化与结构风险最小化

经验风险最小化

经验风险最小化模型如下:

min1Ni=1NL(yi,f(xi)) min 1 N ∑ i = 1 N L ( y i , f ( x i ) )

经验风险最小化的目标是使模型预测出来的结果与真实值尽量接近,但是这可能导致模型为了使预测结果接近真实值而使模型变得复杂,从而可能导致过拟合,即在训练集上效果很好,但是在测试集上效果却不好。

结构风险最小化

于是,为了使模型不过于复杂,就有了结构风险最小化模型:

min1Ni=1NL(yi,f(xi))+λJ(f) min 1 N ∑ i = 1 N L ( y i , f ( x i ) ) + λ J ( f )

也就是在经验风险最小化模型基础上,加上正则化项 J(f) J ( f ) ,正则化项可以是 L1L2 L 1 正 则 化 , 也 可 以 是 L 2 正 则 化 ,通过正则化项对模型的参数进行限制。

损失函数归纳

损失函数公式应用
0-1损失函数 l(y,y^)={1,yy^1,y=y^ l ( y , y ^ ) = { 1 , y ≠ y ^ 1 , y = y ^
交叉熵损失函数 loss=[y^lny+(1y^)ln(1y)] l o s s = − ∑ [ y ^ l n y + ( 1 − y ^ ) l n ( 1 − y ) ] 逻辑回归
hinge损失函数 loss=max(0,1y^y) l o s s = m a x ( 0 , 1 − y ^ ∗ y ) SVM
平方误差损失函数 loss=(y^y)2 l o s s = ∑ ( y ^ − y ) 2 线性回归

* 在神经网络中,当用sigmoid作为激活函数,用平方误差作为损失函数时,可能会导致梯度消失。此时,若用交叉熵作为损失函数,则可以避免梯度消失

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值