TensorFlow中的激活函数总结

最新推荐文章于 2024-06-18 15:30:22 发布

八倍体小黑麦

最新推荐文章于 2024-06-18 15:30:22 发布

阅读量637

点赞数 1

原文链接：https://www.cnblogs.com/xiaobingqianrui/p/10737725

版权

TensorFlow中的激活函数总结

常用激活函数：

tf.sigmoid()

tf.tanh()

tf.nn.relu()

tf.nn.softplus()

tf.nn.softmax()

tf.nn.dropout()

tf.nn.elu()

import numpy as np
import matplotlib.pyplot as plt
from scipy.misc import derivative

def sigmoid(x):
    y = 1 / (1 + np.exp(-x))
    return y

def tanh(x):
    return (np.exp(x) - np.exp(-x)) / (np.exp(x)+np.exp(-x))

def relu(x):
    return [max(xi,0) for xi in x]

def elu(x,a=1):
    y = []
    for xi in x:
        if xi >= 0:
            y.append(xi)
        else:
            y.append(a*(np.exp(xi)-1))
    return y

def softplus(x):
    return np.log(1+np.exp(x))

def derivative_f(func,input,dx=1e-6):
    y = [derivative(func,x,dx) for x in input]
    return y

x = np.linspace(-5,5,1000)

flg = plt.figure(figsize=(15,5))
ax1 = flg.add_subplot(1,2,1)
ax1.axis([-5,5,-1,1])
plt.xlabel(r'active function',fontsize=18)
ax1.plot(x,sigmoid(x),'r-',label='sigmoid')
ax1.plot(x,tanh(x),'g--',label='tanh')
ax1.plot(x,relu(x),'b-',lw=1,label='relu')
ax1.plot(x,softplus(x),'y--',label='softplus')
ax1.plot(x,elu(x),'b--',label='elu')
ax1.legend()
ax2 = flg.add_subplot(1,2,2)
plt.xlabel(r'derivative',fontsize=18)
ax2.plot(x,derivative_f(sigmoid,x),'r-',label='sigmoid')
ax2.plot(x,derivative_f(tanh,x),'g--',label='tanh')
ax2.plot(x,derivative_f(softplus,x),'y-',label='softplus')
ax2.legend()
plt.show()

结果：
在这里插入图片描述
各激活函数优缺点

sigmoid函数

优点：在于输出映射在（0，1）范围内，单调连续，适合用作输出层，求导容易

缺点：一旦输入落入饱和区，一阶导数接近0，就可能产生梯度消失的情况

tanh函数

优点：输出以0为中心，收敛速度比sigmoid函数要快

缺点：存在梯度消失问题

relu函数

优点：目前最受欢迎的激活函数，在x<0时，硬饱和，在x>0时，导数为1，所以在x>0时保持梯度不衰减，从而可以缓解梯度消失的问题，能更快收敛，并提供神经网络的稀疏表达能力

缺点：随着训练的进行，部分输入或落入硬饱和区，导致无法更新权重，称为‘神经元死亡’

elu函数

优点：有一个非零梯度，这样可以避免单元消失的问题

缺点：计算速度比relu和它的变种慢，但是在训练过程中可以通过更快的收敛速度来弥补

softplus函数

该函数对relu做了平滑处理，更接近脑神经元的激活模型

softmax函数

除了用于二分类还可以用于多分类，将各个神经元的输出映射到（0,1空间）

dropout函数

tf.nn.dropout(x,keep_prob,noise_shape=None,seed=None,name=None)

一个神经元以概率keep_prob决定是否被抑制，如果被抑制，神经元的输出为0，如果不被抑制，该神经元将被放大到原来的1/keep_prob倍，默认情况下，每个神经元是否被抑制是相互独立的

一般规则

当输入数据特征相差明显时，用tanh效果很好，当特征相差不明显时用sigmoid效果比较好，sigmoid和tanh作为激活函数需要对输入进行规范化，否则激活后的值进入平坦区，而relu不会出现这种情况，有时也不需要输入规范化，因此85%-90%的神经网络会使用relu函数

八倍体小黑麦

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
TensorFlow中的激活函数总结

TensorFlow中的激活函数总结常用激活函数：tf.sigmoid()tf.tanh()tf.nn.relu()tf.nn.softplus()tf.nn.softmax()tf.nn.dropout()tf.nn.elu()import numpy as npimport matplotlib.pyplot as pltfrom scipy.misc im...
复制链接

扫一扫