三十五.常用激活函数总结

最新推荐文章于 2024-09-07 14:46:01 发布

stackooooover

最新推荐文章于 2024-09-07 14:46:01 发布

阅读量62

点赞数

分类专栏：机器学习实战机器学习理论基础

本文链接：https://blog.csdn.net/weixin_36128607/article/details/119002091

版权

机器学习理论基础同时被 2 个专栏收录

39 篇文章 8 订阅

订阅专栏

机器学习实战

31 篇文章 4 订阅

订阅专栏

1.Sigmod函数

(1)公式

$f(x)=\frac{1}{1+e^{-x}}$
可以将数据映射到 $(0, 1)$ 区间。
缺点：
a.易造成梯度消失。
b.输出非0均值，收敛慢。
c.幂运算复杂，训练时间长。

(2)TF2调用sigmod

import tensorflow as tf
a = tf.constant([-1,0,1,2],dtype=tf.float32)
print(tf.nn.sigmoid(a).numpy())
输出：
[0.26894143 0.5        0.7310586  0.880797  ]

2.Tanh函数

(1)公式

$f(x)=\frac{1-e^{-2x}}{1+e^{-2x}}$
将数据映射到(-1,1)区间。
特点：
a.输出均值是0。
b.易造成梯度消失。
c.幂运算复杂。

(2)TF2调用Tanh

a = tf.constant([-1,0,1,2],dtype=tf.float32)
print(tf.nn.tanh(a).numpy())
输出：
[-0.7615942  0.         0.7615942  0.9640276]

3.Relu函数

(1)公式

$f (x) = m a x (x, 0)$
优点：
a.在正区间解决了梯度消失问题。
b.计算速度快。
c.收敛速度快。
缺点:
a.输出非0均值，收敛慢。
c.有些神经元可能永远不能被激活。

(2)TF2调用Relu

a = tf.constant([-1,0,1,2],dtype=tf.float32)
print(tf.nn.relu(a).numpy())
输出：
[0. 0. 1. 2.]

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

stackooooover

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

史上最全激活函数总结篇（持续更新ing......）

走在深度学习前沿的小宋

09-27

7612

激活函数系列中提及到的激活函数包括：Sigmoid、Tanh、ReLU、Leaky ReLU、PReLU、Swish、ELU、SELU、GELU、Softmax、Softplus、Mish、Maxout、HardSigmoid、HardTanh、Hardswish、HardShrink、SoftShrink、TanhShrink、RReLU、CELU、ReLU6、Threshold、Sinc、GLU、SwiGLU、GTU、Bilinear、ReGLU、GEGLU、Softmin、Softmax2d、Logs

神经网络中的常用激活函数总结

Paper weekly

02-06

3068

©PaperWeekly 原创 ·作者｜张文翔单位｜京东集团算法工程师研究方向｜推荐算法激活函数之性质1. 非线性：即导数不是常数。保证多层网络不退化成单层线性网络。这也是激活函数的意...

参与评论您还未登录，请先登录后发表或查看评论

常用激活函数（激励函数）理解与总结

最新发布

qq_32756029的博客

09-07

1378

常见激活函数总结。

神经网络中常用激活函数总结

Kaiyuan_sjtu的博客

05-30

2万+

好久没写博客和学习笔记了，感觉最近总是没有学习状态呀，就很烦。虽说确实是有在看一些视频课程但是总是精神有力，每天过得也好快总感觉啥都没学时间就过去了阿西。还是得逼最近写写笔记才能不那么恍惚。前几天开始学习Coursera上吴恩达的深度学习课程，然后顺便做做笔记吧。神经元的结构如下图所示，其中f就是激活函数（activation function），它的输入是x的线性组合，然后对其进行某种固定的...

常用的激活函数及其tf.keras实现

忆殇D.Rose的博客

09-26

3088

如果神经网络中没有激活函数，无论网络结构再如何复杂，学习的模型都只能得到线性函数，只能解决线性可分问题。激活函数的引入，使得神经网络能够拟合任何一个非线性函数，可用于解决线性不可分问题。不同的激活函数具有不同的特征，适合的场景也因数据的差异而各不相同，需要根据具体的情况选择合适的激活函数，否则无法得到一个令人满意的模型。这篇博客以tf.keras.activations中提供的激活函数为基础，对...

深度学习中三种常用激活函数的性能对比研究.pdf

09-01

本文主要讨论了三种常见的激活函数——Sigmoid、双曲正切（Tanh）和修正线性单元（ReLU），并进行了性能对比研究。 Sigmoid函数是一种S形曲线函数，其输出值域在0到1之间，常用于二分类问题。然而，Sigmoid函数在...

30年激活函数回顾性总结.pdf

04-17

### 30年激活函数回顾性总结 #### 概述在过去三十年中，神经网络及其在深度学习领域的应用已经成为了解决复杂问题的关键工具，并在众多领域展现出了非凡的能力。其中，激活函数（Activation Functions, AFs）作为...

二十五.决策树之CART决策树的原理和sklearn实现

weixin_36128607的博客

07-13

2333

目录1.简介2.基尼系数3.CART分类树(1)数据集的基尼系数(2)数据集对于某个特征的基尼系数(3)连续值特征处理(4)离散值特征处理 1.简介 CART算法采用的是基尼系数作为划分依据。 ID3、C4.5算法生成的决策树都是多叉树，而CART算法生成的决策树为二叉树。 2.基尼系数基尼系数代表了信息的不纯度，基尼系数越小，不纯度越低，特征越好。在分类问题中，假设有KKK个类别，第kkk个类别的概率为PkP_{k}Pk，则基尼系数为： Gini(P)=∑k=1KPk(1−Pk)=1−∑k=1KPk

十二.softmax多分类和sklearn实现

weixin_36128607的博客

06-29

2224

目录1.softmax函数 1.softmax函数

四十五.门控循环单元(GRU)简介和keras实现

weixin_36128607的博客

09-07

1589

目录1.网络结构(1)记忆体hth^{t}ht(2)候选状态ht^\widehat{h^{t}}ht(3)重置门和更新门 1.网络结构 U是LSTM的一种变体，可以说是简化版本的LSTM，但是预测效果也很不错，因此更常用。 GRU使记忆体hth^{t}ht融合了长期记忆和短期记忆。 (1)记忆体hth^{t}ht ht=zt⊙ht−1+(1−zt)⊙ht^ h^{t}=z^{t}\odot h^{t-1}+(1-z^{t})\odot \widehat{h^{t}} ht=zt⊙ht−1+(1−zt)⊙ht

四十七.模型和正态分布(BoxCox)

weixin_36128607的博客

04-18

1422

1.为什么数据要服从正态分布在深度学习和机器学习中，我们通常希望数据的分布为正态分布，因为在机器学习中，许多模型都是基于数据服从正态分布的假设（例如线性回归，它假设模型的残差服从均值为0方差为σ^2，标准化残差服从均数为0，方差为1 的正态分布）。因此，具有正态分布的数据会对模型的训练效果有着较为显著的提升。 2.BoxCox变换对于不符合正态分布的特征，除了对数变换等，最常用的就是BoxCox变换。 BoxCox变换是一个变换族。 ...

三十.全连接神经网络原理

weixin_36128607的博客

07-19

1408

目录1.网络结构解析(1)图示(2)结构解析2.前向传播(1)前向传播原理(2)前向传播流程3.反向传播(1)反向传播原理 1.网络结构解析 (1)图示 (2)结构解析图中结构一共有四层，最左边为输入层，中间两层为隐藏层，最右边为输出层。通常在说神经网络层数结构的时候不包含输入层，所以输入层也被称为第000层。上图为三层神经网络，图中的各参数代表的意义如下： aila_{i}^{l}ail：第lll层第iii个神经元的输出。 zilz_{i}^{l}zil：第lll层第iii个神经元的未激活输出。

十六.DBSCAN聚类原理和sklearn实现

weixin_36128607的博客

07-02

1358

目录1.基本概念2.算法流程3.sklearn实现DBSCAN(1)数据集 1.基本概念 DBSCAN:具有噪声的基于密度的聚类方法。从名字中就可以看出来，簇划分是根据样本密度来决定的。 ϵϵϵ-邻域：样本xxx以ϵϵϵ为半径的范围内包含的所有样本的集合，这个集合称为xxx的ϵϵϵ-邻域。核心对象：样本xxx的ϵ-领域内样本数大于阈值MinPts，则xxx为核心对象。直接密度可达：若某点ppp在点qqq的ϵϵϵ-邻域内，且qqq是核心对象，则ppp由qqq直接密度可达。密度可达：有序列点q1,q2,q

二.无约束最优化之牛顿法

weixin_36128607的博客

05-18

1268

二.无约束最优化之牛顿法1.牛顿法原理解析 1.牛顿法原理解析牛顿法的核心思想，是函数极值点处的一阶导数为000。在k+1k+1k+1次迭代中，极值存在的必要条件是xk+1x^{k+1}xk+1处的导数为0，即： ∇f(xk+1)=0\nabla f(x^{k+1})=0∇f(xk+1)=0 将f(xk+1)f(x^{k+1})f(xk+1)在xkx^{k}xk处进行二阶泰勒展开： ...

神经网络基础：单个神经元与常用激活函数详解

线性分类器通过矩阵运算计算出图像类别得分，而神经网络则引入了非线性激活函数，如通常采用的阈值函数（将所有小于0的值置零），将输入映射到更高维度的空间。这种非线性处理使得网络能够捕捉更复杂的数据模式，而...