激活函数小结

李一帆'

已于 2024-11-05 16:11:32 修改

阅读量887

点赞数 11

文章标签：深度学习

于 2024-06-17 12:11:26 首次发布

本文链接：https://blog.csdn.net/qq_44930244/article/details/139740131

版权

摘要

本篇博客对一些激活函数进行总结，以便加深理解和记忆

何时使用
- 将模型的值压缩到[0,1]范围内的概率值，适用于二分类或置信度
- 梯度平滑，便于求导
缺点
- 容易造成梯度消失。我们从导函数图像中了解到sigmoid的导数都是小于0.25的，那么在进行反向传播的时候，梯度相乘结果会慢慢的趋向于0。这样几乎就没有梯度信号通过神经元传递到前面层的梯度更新中，因此这时前面层的权值几乎没有更新，这就叫梯度消失。除此之外，为了防止饱和，必须对于权重矩阵的初始化特别留意。如果初始化权重过大，可能很多神经元得到一个比较小的梯度，致使神经元不能很好的更新权重提前饱和，神经网络就几乎不学习
- 函数输出不是以 0 为中心的，梯度可能就会向特定方向移动，从而降低权重更新的效率
- 执行指数运算，计算机运行得较慢，比较消耗计算资源

Sigmoid函数在历史上曾非常常用，但是现在它已经不太受欢迎，实际中很少使用