softmax层_Softmax理解之Smooth程度控制

本文深入探讨Softmax交叉熵损失函数的优化与平滑度控制。通过对比Softmax和LogSumExp函数,揭示在输入分数较小时,Softmax不能很好地近似目标函数的问题。引入‘温度’参数来调整Softmax的平滑度,并讨论了特征衰减和特征权重归一化的解决方案,以应对小幅度输入分数带来的挑战。
摘要由CSDN通过智能技术生成

这篇文章是Softmax理解系列之三,没看过前两篇的这里有传送门:

王峰:从最优化的角度看待Softmax损失函数

王峰:Softmax理解之二分类与多分类

这一篇主要是第一篇内容的延续,使用了我的文章里的一些结论:

L2 Hypersphere Embedding for Face Verification

英文和数学比较好的可以先看看我这篇论文。

在第一篇文章中我们利用最优化里常见的 smooth 操作,将一个难以优化的分类目标函数经过两步 smooth 化后转变为常见的 Softmax交叉熵损失函数。文章发出来以后, @苏剑林 跟我说优化目标可以改得更简洁一些:

通过网络输出
个分数,使得目标分数最大。

换成数学语言,就是要让:

这样,其对应的损失函数形式就非常简单了:

这个损失函数起到的作用是:当

恰好是
中最大的元素时,损失函数为0;当某非目标分数
大于目标分数
时,就产生了一个正的损失。同样的,通过使用 LogSumExp 函数就可以将这个损失函数转化为 Softmax 交叉熵损失。感兴趣的读者可以自行推导一下作为练习。

经过这样的修改我们将所有的

一视同仁,其实是不利
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值