常见激活函数及tensorflow使用

最新推荐文章于 2023-08-04 19:14:27 发布

kkkwi

最新推荐文章于 2023-08-04 19:14:27 发布

阅读量1.8k

点赞数 3

文章标签： tensorflow 机器学习深度学习

本文链接：https://blog.csdn.net/weixin_47394115/article/details/119610300

版权

激活函数

激活函数使输出的函数不再为线性，加入非线性因素，使得可以加入更多的网络层数，计算更多的函数。

唯一能使用线性激活函数的地方为机器学习的回归问题

下面介绍几种常用的激活函数：

$\sigma(x) = \frac{ 1}{1+ e^{-x}}$
sigmoid

$\frac{ e^{x}-e^{-x}}{e^{x}+ e^{-x}}$

在这里插入图片描述

$f (x) = m a x (0, x)$
在这里插入图片描述

不会有梯度消失问题加快了训练速度，但是在z<0处值为0.
由于梯度以指数方式在层中消失，导致网络较底层的训练速度非常慢。ReLU 对输入内容的所有值都应用了函数 $f (x) = m a x (0, x)$ 。用基本术语来说，这一层把所有的负激活（negative activation）都变为零。这一层会增加模型乃至整个神经网络的非线性特征，而且不会影响卷积层的感受野。

$f (x) = m a x (α x, x)$

在这里插入图片描述

$s w i s h (x) = x \cdot s i g m o i d (β x)$
在这里插入图片描述

$Mish(x)=x·tanh(ln(1+e^{x}))$
在这里插入图片描述

在tensorflow中在建立模型时需要用到激活函数，其中activation为调用激活函数。

#激活函数为relu
tf.keras.layers.Dense(128, activation='relu')
#这是一层激活函数为softmax层，一般用于模型最后分类问题
tf.keras.layers.Dense(10, activation='softmax')

model.add(Conv2D(kernel_size=(3, 3), strides=(1, 1), padding="same", filters=384,
				 activation='relu', kernel_initializer='he_normal'))

关注