交叉熵损失函数

最新推荐文章于 2024-08-01 16:15:00 发布

baihaisheng

最新推荐文章于 2024-08-01 16:15:00 发布

阅读量391

点赞数

分类专栏：深度学习 NLP 文章标签：自然语言处理神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41128383/article/details/106082702

版权

NLP 同时被 2 个专栏收录

88 篇文章 4 订阅

订阅专栏

22 篇文章 4 订阅

订阅专栏

交叉熵损失函数是用来衡量神经网络的预测值与实际值的一种方式。与均方差损失函数相比，它能更有效地促进网络的训练

交叉熵损失函数与均方误差损失函数比较

结论：一般网络训练选择交叉熵而不选择均方差，具体原因分析如下

均方误差损失函数
预测数据和真实数据对应点误差平方和的均值，n为样本的个数

以一个样本为例，此时损失函数为：

根据反向传播求w的梯度：

导数为

sigmoid函数及导数的图像
在这里插入图片描述

从上述图可知
在这里插入图片描述值接近0或者1的时候求得的梯度值会接近于0，
由参数更新公式：w=w-学习率×损失函数对参数的偏导可知，偏导很小时，参数更新速度会变得很慢，而当偏导接近于0时，参数几乎就不更新了，会导致网络训练越慢

交叉熵损失
还是以单个样本的一次梯度下降为例
前向传播的线性和非线性部分

二分类交叉熵损失函数

二分类交叉熵损失函数对参数w的偏导：

交叉熵对参数w的偏导没有sigmoid导数，所以不存在均方误差导致网络参数更新慢的问题，所以一般选择交叉熵作为损失函数

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。