神经网络训练：不变的Loss与提升的Accuracy？

最新推荐文章于 2024-06-19 15:31:46 发布

dyhBUPT

最新推荐文章于 2024-06-19 15:31:46 发布

阅读量2.4k

点赞数

分类专栏：机器学习基本概念文章标签：深度学习损失函数准确率

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42191914/article/details/103329530

版权

机器学习基本概念专栏收录该内容

7 篇文章 0 订阅

订阅专栏

推荐阅读：一种简单的解释
今天学习CS231n课程第6讲，老师提出了一个问题：在训练开始时，低学习率情况下，为什么可能出现“损失几乎不变，准确率明显提高”这样的现象？（视频课程中对这里解释的不太清楚）
备注：交叉熵损失+softmax
在这里插入图片描述
当然，类似问题也可以是，“损失和正确率同时上升”这样奇怪的现象？
我通过查找网络相关内容以及和LY师兄交流，终于搞懂了其原因：损失函数和准确率计算方法的区别！

交叉熵损失：
在这里插入图片描述
我们可以看到，交叉熵损失与对某每一类别 i 的预测分数的log相关；而准确率却是个硬判决，及输出层哪一类的分数高就判为那一类，结果正确那么准确率就增加（无论得分高低）

这样，我们就发现了其中的端倪，假设我们有两类。在初始阶段，softmax的输出都趋于[0.5, 0.5]这样的结果，其上下波动会随机进行预测，从而使正确率为50%左右。

当稍微进行了一点学习时，可能对应样本的输出会分别趋向于输出**[0.51,0.49]与[0.49,0.51]，也就是分类不那么随机**了，而是趋于向正确的方向调整（虽然准确率不高）。

这样，此时准确率自然是上升的，而根据交叉熵损失的计算方法，由于输出向量并没有较大改变，所以Loss函数的结果并没有明显变化。这从而就导致了Acc up, Loss flat的神奇现象。
所以，其背后原理是十分简单的！

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
神经网络训练：不变的Loss与提升的Accuracy？

推荐阅读：一种简单的解释
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。