激活函数与损失函数的配对问题

最新推荐文章于 2022-11-29 21:36:59 发布

Paul-LangJun

最新推荐文章于 2022-11-29 21:36:59 发布

阅读量598

点赞数

分类专栏：机器学习神经网络文章标签：神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gaoxueyi551/article/details/104462041

版权

神经网络同时被 2 个专栏收录

45 篇文章 10 订阅

订阅专栏

35 篇文章 4 订阅

订阅专栏

输出层的激活函数应该选择何种损失函数做搭配影响着神经网络的训练速度，并间接影响在测试数据上的分类准确性。本文抛砖引玉，整理并分析几种组合情况。

一、Sigmod与均方损失

这是一个糟糕的搭配。为什么那？因为一个小小的符号 $\sigma^{'} (\textbf{\textit{z}}^L)$ ，它是sigmod的导数，sigmod图像如下

在两端尾部的导数接近于0，结合下式输出层的学习误差可知，当输出层的学习率下降后，会间接的通过反向传播影响其它各层的学习率。

$\delta ^L=(\textbf{\textit{a}}^L-\textbf{\textit{y}}^L)\ \bigodot \ \sigma^{'} (\textbf{\textit{z}}^L)$

二、Sigmod与交叉熵损失

这是sigmod的绝佳搭档。先来看看交叉熵损失函数的定义。

$C=-\frac{1}{n}\sum [ylna + (1-y)ln(1-a)]$

当预测值和真实值一致时，损失为0，当预测值和真实值不一致时，损失会无限大。

现在来看输出层权重的导数（具体推导可查阅相关文档），如下

$\frac{\partial C}{\partial w_{jk}^L}=\frac{1}{n}\sum_{x_i}^{n}a_k^{L-1}(a_j^L-y_j^L)$

很棒，现在 $\sigma^{'} (\textbf{\textit{z}}^L)$ 消除了，学习率下降的可能性大大降低。关于偏置的情形与此类似。

三、线性激活函数与均方损失

如果 $\textbf{\textit{z}}^L = \textbf{\textit{a}}^L$ ，即权重输入等于激活输出。那么此时输出层权重的导数为

$\frac{\partial C}{\partial w_{jk}^L}=\frac{1}{n}\sum_{x_i}^{n}a_k^{L-1}(a_j^L-y_j^L)$

所以，如果输出层对权重输入不进行非线性变换， $\sigma^{'} (\textbf{\textit{z}}^L)$ 也可能会消失。

四、softmax与log-likelihood cost（log-似然损失）

这个组合常用于多分类中，特别是对输出概率分布有强烈需求的应用。

先来看看 softmax 的定义，它其实对输出层各个神经元的激活输出进行了一个概率转换

$a_j^L=\frac{z_j^L}{\sum_{k=1}^{n^L}z_k^L}$

再来一窥 log-likelihood cost

$C = -\ln a_y^L$

其中， a_y^L 表示输出层的预测概率，因为输出层每个神经元都关联一个概率值，最终取最大值作为预测概率。可以看出，当预测概率对应的神经元编号等于标签值时，损失为0，反之损失无限大。举个例子，假如在进行识别范围 0-9 的手写体数字，输出层有10个神经元，如果第2个神经元有最大的输出概率，则预测概率的值是第2个神经元的输出概率，那么模型认为该样本的标签会是2，如果确实是2，那么损失会很小；反之，损失会很大。

关于权重和偏置的导数同上，不含 $\sigma^{'} (\textbf{\textit{z}}^L)$ 项，所以学习率下降的可能性不大。

五、总结

以上4种组合，只是众多组合中的几种而已，只要激活函数和损失函数不断出现，组合也会不断出现。它们共同的目的便是把学习率下降的可能性降到最低，使得什么网络模型得到最大限度的训练。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。