【深度学习】关键技术-激活函数（Activation Functions）

IT古董

已于 2025-01-14 12:33:36 修改

阅读量1.4k

点赞数 36

分类专栏：深度学习人工智能机器学习文章标签：深度学习人工智能激活函数

于 2025-01-14 09:57:56 首次发布

本文链接：https://blog.csdn.net/IT_ORACLE/article/details/145130155

版权

激活函数（Activation Functions）

激活函数是神经网络的重要组成部分，它的作用是将神经元的输入信号映射到输出信号，同时引入非线性特性，使神经网络能够处理复杂问题。以下是常见激活函数的种类、公式、图形特点及其应用场景。

1. 常见激活函数及其公式与代码示例

1. Sigmoid 激活函数

公式：

$\sigma(x) = \frac{1}{1 + e^{-x}}$

特点：

输出范围为 (0, 1)。
对输入较大的值趋于 1，较小的值趋于 0。
常用于神经网络输出层处理二分类问题。
优点：
- 将输入映射为概率值，直观且常用于概率任务。
缺点：
- 梯度消失：输入很大或很小时，梯度趋近 0，导致反向传播时权重更新变慢。
- 输出不以 0 为中心，不利于零均值数据。

代码示例：

import numpy as np
import matplotlib.pyplot as plt

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# 示例
x = np.linspace(-10, 10, 100)
y = sigmoid(x)

plt.plot(x, y)
plt.title("Sigmoid Activation Function")
plt.xlabel("x")
plt.ylabel("sigmoid(x)")
plt.grid()
plt.show()