神经网络的Python实现（二）全连接网络

最新推荐文章于 2024-01-08 08:34:48 发布

leeeon233

最新推荐文章于 2024-01-08 08:34:48 发布

阅读量2.5k

点赞数 1

分类专栏： Deep Learning 文章标签：全连接网络 BP 梯度下降反向传播

本文链接：https://blog.csdn.net/leeeon233/article/details/83515866

版权

本文深入探讨了全连接神经网络的Python实现，包括前向传播、激活函数（sigmoid、tanh、relu）及反向传播的详细过程。通过实例展示了BP算法在多层神经网络中的应用，并提供了基于numpy的代码实现。文章最后通过训练异或问题验证了模型的可行性。

摘要由CSDN通过智能技术生成

在上一篇神经网络的Python实现（一）了解神经网络中，我们简单介绍了感知机模型和多层网络的基础结构。在这篇博文中，我们将使用python-numpy库搭建多层神经网络模型、介绍和实现BP算法。理论部分有部分参考。

更好的阅读效果，欢迎前往我的个人博客地址

全连接网络

首先，简单介绍一下全连接网络(Fully-Connected Network)，即在多层神经网络中，第 $n$ 层的每个神经元都分别与第 $n - 1$ 层的神经元相互连接。如下图便是一个简单的全连接网络：

全连接网络示意图

我们使用圆圈来表示神经网络的输入，标上 $+ 1$ 的圆圈被称为偏置节点，也就是截距项。神经网络最左边的一层叫做输入层，最右的一层叫做输出层（上图中，输出层只有一个节点）。中间所有节点组成的一层叫做隐藏层，因为我们不能在训练样本集中观测到它们的值。同时可以看到，以上神经网络的例子中有3个输入单元（偏置单元不计在内），3个隐藏单元及一个输出单元。

我们用 $n_l$ 来表示网络的层数，上图例子中 $n_l=3$ ，我们将第 $ l $ 层记为 $L_l$ ，于是 $L_1$ 是输入层，输出层是 $L_{n_l}$ 。本例神经网络有参数 $W,b) = (W^{(1)}, b^{(1)}, W^{(2)}, b^{(2)})$ ，其中 $W^{(l)}_{ij}$ 是第 $l$ 层第 $j$ 单元与第 $l + 1$ 层第 $i$ 单元之间的联接参数（其实就是连接线上的权重，注意标号顺序）， $b^{(l)}_i$ 是第 $l + 1$ 层第 $i$ 单元的偏置项。因此在本例中， $W^{(1)} \in \Re^{3\times 3}$ ， $W^{(2)} \in \Re^{1\times 3}$ 。注意，没有其他单元连向偏置单元(即偏置单元没有输入)，因为它们总是输出 $+ 1$ 。同时，我们用 $s_l$ 表示第 $l$ 层的节点数（偏置单元不计在内）。

接下来详细介绍神经网络的前向和反向的计算过程。

前向传播

我们用 $a^{(l)}_i$ 表示第 $l$ 层第 $i$ 单元的激活值（输出值）。当 $l = 1$ 时， $a^{(1)}_i = x_i$ ，也就是第 $i$ 个输入值（输入值的第 $i$ 个特征）。对于给定参数集合 $W, b$ ，我们的神经网络就可以按照函数 $h_{W,b}(x)$ 来计算输出结果。本例神经网络的计算步骤如下：

$\begin{aligned} a_1^{(2)} &= f(W_{11}^{(1)}x_1 + W_{12}^{(1)} x_2 + W_{13}^{(1)} x_3 + b_1^{(1)}) \\ a_2^{(2)} &= f(W_{21}^{(1)}x_1 + W_{22}^{(1)} x_2 + W_{23}^{(1)} x_3 + b_2^{(1)}) \\ a_3^{(2)} &= f(W_{31}^{(1)}x_1 + W_{32}^{(1)} x_2 + W_{33}^{(1)} x_3 + b_3^{(1)}) \\ h_{W,b}(x) &= a_1^{(3)} = f(W_{11}^{(2)}a_1^{(2)} + W_{12}^{(2)} a_2^{(2)} + W_{13}^{(2)} a_3^{(2)} + b_1^{(2)}) \end{aligned}$

我们用 $z^{(l)}_i$ 表示第 $l$ 层第 $i$ 单元输入加权和（包括偏置单元），比如， $z_i^{(2)} = \sum_{j=1}^n W^{(1)}_{ij} x_j + b^{(1)}_i$

最低0.47元/天解锁文章

leeeon233

关注

1
点赞
踩
16

收藏

觉得还不错? 一键收藏
7
评论
神经网络的Python实现（二）全连接网络

在上一篇神经网络的Numpy实现（一）了解神经网络中，我们简单介绍了感知机模型和多层网络的基础结构。在这篇博文中，我们将使用python-numpy库搭建多层神经网络模型、介绍和实现BP算法。理论部分有部分参考。我的个人博客地址全连接网络首先，简单介绍一下全连接网络(Fully-Connected Network)，即在多层神经网络中，第 nnn 层的每个神经元都分别与第 n−1n-1n...
复制链接

扫一扫