吴恩达神经网络和深度学习-学习笔记-2-激活函数

最新推荐文章于 2024-05-05 14:44:40 发布

Harry嗷

最新推荐文章于 2024-05-05 14:44:40 发布

阅读量537

点赞数

分类专栏：吴恩达神经网络和深度学习-学习笔记文章标签：深度学习

本文链接：https://blog.csdn.net/qq_41683065/article/details/95729602

版权

吴恩达神经网络和深度学习-学习笔记专栏收录该内容

46 篇文章 22 订阅

订阅专栏

sigmoid

在这里插入图片描述
除非在二元分类的输出层，否则千万不要用
吴老师几乎没用过，因为tanh几乎在所有场合都更优越

tanh

在这里插入图片描述
激活函数tanh()的效果几乎总比sigmoid函数好，因为tanh的输出位于[-1，1]之间，激活函数tanh的平均值就更接近0.
你可能需要平移所有数据，让数据平均值为0。使用tanh函数而不是sigmoid函数也有类似数据中心化的作用（使数据的平均值接近0）。而这实际上让下一层的学习更方便一些。

在大部分场合，tanh都要比sigmoid更优越一些。
但是在输出层output layer，将输出y_hat定在[0,1]之间要更合理。所以sigmoid一般用于输出层。
也就是说在隐藏层hidden layer中用tanh代替sigmoid，在输出层output layer依旧使用sigmoid。

但是tanh函数和sigmoid函数都存在一个相同的问题，那就是当z过大或过小时，导数的梯度或者说这个函数的斜率就会变得很小，这样会拖慢梯度下降算法

ReLU(修正线性单元)

a=max(0,z)。ReLU是最常用的激活函数
即z<0时斜率为0，z>0时斜率为1。
在z=0的时候是没有导数的定义的，而且在实际应用中，数据为0.000……00……的概率非常小，所以把z=0处的导数定为1或0都是可以的。

在选择激活函数时有一些经验法则：
如果你的输出值时0和1，如果你在做二元分类，那么sigmoid函数很适合作为输出层的激活函数，然后其他单元都用ReLU。
ReLU现在已经变成激活函数的默认选择了。如果你不确定隐藏层应该用哪个，就用ReLU作为激活函数。
ReLU的一个缺点是，当z<0时导数等于0，虽然这在实践中没有什么问题。
但ReLU还有另一个版本，叫做带泄露的ReLU（leaky ReLU）。
在这里插入图片描述
当z<0时斜率不再为0，它有一个很平缓的斜率。leaky ReLU通常效果比ReLU要好，但在实际中的使用频率没有那么高。
ReLU的优点是，当z很大时，函数的斜率也和0差很远，所以神经网络的学习速度通常会快得多