【深度学习中的激活函数的整理与使用总结】

最新推荐文章于 2024-01-05 13:57:06 发布

vcsir

最新推荐文章于 2024-01-05 13:57:06 发布

阅读量642

点赞数

文章标签：深度学习机器学习人工智能神经网络 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vcsir/article/details/126133505

版权

本文介绍了深度学习中激活函数的重要性和作用，包括线性、sigmoid、tanh、ReLU和softmax等常见激活函数的特性、适用场景及优缺点。重点讨论了ReLU作为广泛使用的激活函数，以及在二分类问题中sigmoid的应用。

摘要由CSDN通过智能技术生成

深度学习中的激活函数的整理与使用总结

介绍
为什么我们需要它？
激活函数的种类
选择正确的激活函数
Python代码实现
结论

介绍

激活函数定义如下：激活函数计算加权总和，然后对其添加偏差以决定是否应该激活神经元。激活函数的目标是将非线性引入神经元的输出。没有激活函数的神经网络基本上是深度学习中的线性回归网络模型，因为这些函数对神经网络的输入执行非线性计算，使其能够学习和执行更复杂的任务。因此，研究激活函数的导数和应用，以及分析每个激活函数的优缺点，对于选择在特定神经网络模型中可能具有非线性和准确性的适当类型的激活函数是至关重要的。
在这里插入图片描述
我们知道神经网络中的神经元是按照它们的权重、偏差和激活函数而工作的，根据输出误差去改变神经网络中神经元的权重和偏差。反向传播就是这个过程的术语，由于梯度与误差同时提供更新权重和偏差，因此激活函数支持反向传播。

为什么我们需要它？

非线性激活函数：如果没有激活函数，神经网络只是一个线性回归模型。激活函数以非线性方式转换输入，使其能够学习并完成更复杂的任务。

激活函数的种类

1）线性激活函数

• 方程：线性函数的方程是y = ax，与直线方程非常相似。

• -inf 到 +inf 范围

• 应用：线性激活函数仅在输出层使用一次。

• 问题：如果我们对线性函数进行微分以引入非线性，则结果将不再与输入“x”相关并且函数将变为常数，因此我们的程序将不会显示任何行为。

在这里插入图片描述

2）sigmoid激活函数：

• 这是一个以“S”形形式绘制的函数。

• 公式：A = 1/(1 + ex)

•非线性。X 的值范围从 -2 到 2，但 Y 值非常陡峭。这表明x 的微小变化将导致 Y 值的巨大变化。

• 0 到 1 的范围值

在这里插入图片描述

3）Tanh 激活函数：

Tanh 函数，也被称为正切双曲函数，是一种几乎总是比 sigmoid 函数效果更好的激活函数。它只是一个经过调整的 sigmoid 函数。两者都是相关的，可以相互推导出来。

• 方程：f(x) = tanh(x) = 2/(1 + e-2x) – 1 OR tanh(x) = 2 * sigmoid(2x) – 1 OR tanh(x) = 2 * sigmoid(2x) – 1
• 值范围：-1 到 +1

• 用途：通常用于神经网络的隐藏层，因为它的值从 -1 变为 1，导致隐藏层的平均值为 0 或非常接近它，这有助于通过使平均值接近 0 来帮助数据中心化，这使得学习下一层更加直接。

在这里插入图片描述

4&#

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

vcsir 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。