神经网络的层是什么？

原创于 2025-12-13 10:23:39 发布 · 847 阅读

CC 4.0 BY-SA版权

文章标签：

神经网络的层是什么？

这是一个非常基础且核心的概念。我们可以用一个非常直观的比喻来理解它。

想象一个工厂的流水线，这个流水线的任务是将一堆原始原材料（比如木头和金属）加工成一个精美的玩具（比如一个机器人）。

每一个加工站（层）都负责完成一项特定的、越来越复杂的任务，并将处理后的半成品传递给下一个加工站。

一个层就是一组神经元的集合。这些神经元：

信息从输入层开始，依次经过一个又一个的层，每一层都对信息进行一番处理和提炼，直到最终从输出层产生结果。

在一个典型的神经网络中，主要有三种类型的层，它们扮演着不同的角色：

a) 输入层

角色：数据接收站。它是网络的入口，负责接收最原始、未加工的数据。
特点：层的神经元数目通常由输入数据的维度决定。例如，处理一张28x28的灰度图，输入层就需要有784个神经元（28*28=784）。这一层通常不进行计算，只是将数据传递下去。

b) 隐藏层

c) 输出层

角色：结果生成器。它是网络的出口，负责产生最终的预测或结果。
特点：其结构和神经元数量由任务决定。
- 二分类（如“是猫”/“不是猫”）：通常使用1个神经元，配合Sigmoid激活函数。
- 多分类（如“猫”/“狗”/“车”）：通常使用多个神经元（每个类别一个），配合Softmax激活函数，输出每个类别的概率。
- 回归（如预测房价）：使用1个神经元，通常不使用激活函数或使用线性激活函数。

假设一个神经网络要识别一张28x28像素的手写数字图片。

输入层：有 28 * 28 = 784 个神经元。每个神经元接收一个像素的亮度值（0-255）。
隐藏层（第1层）：可能有512个神经元。它们接收784个输入，每个神经元学习检测原始像素中某种特定的微小模式（比如某一种朝向的短边）。
隐藏层（第2层）：可能有256个神经元。它们接收512个来自第一层的“边缘”信号，并开始将这些边缘组合成更复杂的形状（比如弧线、角点）。
隐藏层（第3层）：可能有128个神经元。它们进一步组合，形成数字的部件，如一个圈、一条竖线。
输出层：有10个神经元（对应数字0-9）。每个神经元输出一个概率值，代表输入图片是该数字的可能性。最终，网络会选择概率最高的那个神经元所对应的数字作为预测结果。