交叉熵损失函数优缺点_交叉熵损失函数

最新推荐文章于 2023-02-18 15:36:38 发布

weixin_39608748

最新推荐文章于 2023-02-18 15:36:38 发布

阅读量2.1k

点赞数 2

文章标签：交叉熵损失函数优缺点

本文链接：https://blog.csdn.net/weixin_39608748/article/details/111499286

版权

交叉熵代价函数(Cross-entropy cost function)是用来衡量人工神经网络(ANN)的预测值与实际值的一种方式。与二次代价函数相比，它能更有效地促进ANN的训练。在介绍交叉熵代价函数之前，本文先简要介绍二次代价函数，以及其存在的不足。

二次代价函数的不足

ANN的设计目的之一是为了使机器可以像人一样学习知识。人在学习分析新事物时，当发现自己犯的错误越大时，改正的力度就越大。比如投篮：当运动员发现自己的投篮方向离正确方向越远，那么他调整的投篮角度就应该越大，篮球就更容易投进篮筐。同理，我们希望：ANN在训练时，如果预测值与实际值的误差越大，那么在反向传播训练的过程中，各种参数调整的幅度就要更大，从而使训练更快收敛。然而，如果使用二次代价函数训练ANN，看到的实际效果是，如果误差越大，参数调整的幅度可能更小，训练更缓慢。

以一个神经元的二类分类训练为例，进行两次实验(ANN常用的激活函数为sigmoid函数，该实验也采用该函数)：输入一个相同的样本数据x=1.0(该样本对应的实际分类y=0)；两次实验各自随机初始化参数，从而在各自的第一次前向传播后得到不同的输出值，形成不同的代价(误差)：

图片.png

实验1：第一次输出值为0.82

image

实验2：第一次输出值为0.98

在实验1中，随机初始化参数，使得第一次输出值为0.82(该样本对应的实际值为0)；经过300次迭代训练后，输出值由0.82降到0.09，逼近实际值。而在实验2中，第一次输出值为0.98，同样经过300迭代训练，输出值只降到了0.20。

从两次实验的代价曲线中可以看出：实验1的代价随着训练次数增加而快速降低，但实验2的代价在一开始下降得非常缓慢；直观上看，初始的误差越大，收敛得越缓慢。

其实，误差大导致训练缓慢的原因在于使用了二次代价函数。二次代价函数的公式如下：

图片.png

最低0.47元/天解锁文章

weixin_39608748

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
交叉熵损失函数优缺点_交叉熵损失函数

交叉熵代价函数(Cross-entropy cost function)是用来衡量人工神经网络(ANN)的预测值与实际值的一种方式。与二次代价函数相比，它能更有效地促进ANN的训练。在介绍交叉熵代价函数之前，本文先简要介绍二次代价函数，以及其存在的不足。二次代价函数的不足ANN的设计目的之一是为了使机器可以像人一样学习知识。人在学习分析新事物时，当发现自己犯的错误越大时，改正的力度就越大。比如投篮...
复制链接

扫一扫