全连接前馈网络：深度学习的基础架构解析-CSDN博客

本文链接：https://blog.csdn.net/m0_73640344/article/details/143194233

全连接前馈网络：深度学习的基础架构解析

全连接前馈网络，也称为多层感知机（MLP, Multi-Layer Perceptron），是深度学习中最基础的神经网络结构之一。这种网络由多个层次的神经元组成，每一层都完全连接到前一层，信息只在一个方向上流动，即从输入层通过隐藏层（可以有多个）到输出层。下面详细解释全连接前馈网络的各个组成部分及其功能：

1. 结构组成

输入层（Input Layer）：这是网络的第一层，负责接收输入数据。每个输入单元代表输入数据的一个特征。
隐藏层（Hidden Layers）：在输入层和输出层之间可以有多个隐藏层。隐藏层的神经元接收前一层输出的加权和，通过激活函数处理后输出到下一层。隐藏层是网络进行特征提取和学习的主要场所。
输出层（Output Layer）：网络的最后一层，负责产生最终的输出，这些输出可以是分类的标签、连续值等，具体取决于所面对的问题类型。

2. 工作流程

前向传播（Forward Propagation）：
1. 加权求和：每个神经元接收来自前一层神经元的输入，这些输入根据对应的权重进行加权求和。
2. 激活：加权求和的结果通过一个激活函数进行转换，以引入非线性，使网络能够学习和模拟更复杂的函数。常用的激活函数包括ReLU、Sigmoid和Tanh等。
3. 传递：激活后的值传递到下一层神经元，直到最终输出。
反向传播（Back Propagation）：一旦得到输出层的结果，将计算输出与实际结果的误差，并使用这个误差来调整网络中的权重。这个过程涉及到误差梯度的计算，梯度将根据链式法则自输出层向输入层逐层反向传播，更新每个连接的权重，以减小误差。

3. 学习过程

损失函数（Loss Function）：定义了输出结果与实际值之间的差异。常见的损失函数包括均方误差（用于回归问题）和交叉熵损失（用于分类问题）。
优化算法（Optimizer）：用来更新网络权重，最常用的优化算法是梯度下降及其变体，如SGD、Adam等。优化算法决定了如何根据损失函数的梯度来更新网络中的权重，以减少预测误差。