优化篇-【激活函数】

最新推荐文章于 2023-11-17 06:59:03 发布

DisguiseR6

最新推荐文章于 2023-11-17 06:59:03 发布

阅读量403

点赞数 2

分类专栏： # 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_25614773/article/details/89302061

版权

深度学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

【激活函数】

文章目录

【激活函数】

1.什么是激活函数

1.1 什么是激活函数

将输入映射为一个特定分布的输出，完成非线性变换

在这里插入图片描述

2. 为什么需要激活函数

2.1.大脑的生物机制

在这里插入图片描述

2.2 网络的表达能力

神经元模型

$y_{j}=b_{j}+\sum_{i} x_{i} w_{j i}\\ z=b^{\prime}+\sum_{j} y_{j} w_{j}^{\prime}=b^{\prime}+\sum_{j}\left(b_{j}+\sum_{i} x_{i} w_{j i}\right) w_{j}^{\prime}=b^{\prime}+\sum_{j}\left(b_{j} w_{j}^{\prime}\right)+\sum_{i}\left(\sum_{j} x_{i} w_{j i} w_{j}^{\prime}\right)$

增加一层后表达还是线性的

$\color{Red}没有激活函数就没有非线性表达能力$

3.激活函数的发展

3.1 激活函数种类

3.2 sigmoid 和 tanh 激活函数

$sigmoid(x)=\frac{1}{1+e^{-x}}\\ \tanh (\mathrm{x})=\frac{e^{x}-e^{-x}}{e^{x}+e^{-x}}$

在这里插入图片描述

3.2.1.sigmoid 函数优缺点：

优点——输出0—1，映射平滑适合预测概率，但是没有复值激活
缺点——不过零点， $\color{Red}梯度消失$

3.2.2tanh函数优缺点:

优点——映射（-1，1）之间，过零点，值域更大
缺点—— $\color{Red}梯度消失$

3.3 ReLu激活函数

$f (x) = m a x （ 0, x ）$

优点——计算简单，导数恒定，拥有稀疏性

缺点——没有负激活值

3.4 Relu激活函数的改进

激活函数负值输入，未证明全面比ReLu提升

在这里插入图片描述

3.5Maxout函数

从多个输入中取最大值，求导非常简单，只在最大值得一路有梯度

$\max a_{k}=\max \left(w_{1}^{T} x+b_{1}, w_{2}^{T} x+b_{2}, \ldots, w_{n}^{T} x+b_{n}\right)$

优点——拟合能力非常强
缺点——计算量增加，增加了K个神经元

4. 总结与展望

4.1.激活函数从人工设计到自动学习

Swish函数—— $\cdot sigmoid(\beta x)$

关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
优化篇-【激活函数】

【激活函数】文章目录【激活函数】1.什么是激活函数1.1 什么是激活函数2. 为什么需要激活函数2.1.大脑的生物机制2.2 网络的表达能力3.激活函数的发展3.1 激活函数种类3.2 sigmoid 和 tanh 激活函数3.2.1.sigmoid 函数优缺点：3.2.2tanh函数优缺点:3.3 ReLu激活函数3.4 Relu激活函数的改进3.5Maxout函数4. 总结与展望4.1.激活...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。