深度学习中的激活函数

最新推荐文章于 2024-06-07 10:42:49 发布

dzzxjl

最新推荐文章于 2024-06-07 10:42:49 发布

阅读量2k

点赞数 1

分类专栏： # TensorFlow 2.6.1 文章标签：深度学习人工智能计算机视觉

本站点用作笔记使用，如有侵权，请联系我进行删除，谢谢

本文链接：https://blog.csdn.net/dzzxjl/article/details/122400368

版权

3 篇文章 0 订阅

订阅专栏

激活函数（activation function）的反函数为连接函数。
在这里插入图片描述

修正线性单元（Rectified Linear Unit, ReLU）
a = max(0, z) 简单而粗暴，大于0的留下，否则一律为0
ReLU函数会使得部分神经元不会产生激活，造成网络结构的稀疏性，缓解过拟合的问题
优点：由上图可以看出，Relu得到的SGD的收敛速度较快
缺点：训练的时候很容易‘die’了，对于小于0的值，这个神经元的梯度永远都会是0，在实际操错中，如果learning rate很大，很可能网络中较多的神经元都’dead’了，即使是较小的learning rate，这种情况也很有可能发生。

因为神经网络是不断反复计算，实际上变成了它在尝试不断试探如何用一个大多数为0的矩阵来尝试表达数据特征,结果因为稀疏特性的存在，反而这种方法变得运算得又快效果又好了

ReLU：其输出不关于原点对称；反向传播时，输入神经元小于0时，会有梯度消失问题；当x=0时，该点梯度不存在（未定义）；ReLu失活（dead RELU）原因：权重初始化不当、初始学习率设置的非常大

在这里插入图片描述

关注

专栏目录