神经网络之前向传播

最新推荐文章于 2024-09-20 21:48:01 发布

逍遥豚

最新推荐文章于 2024-09-20 21:48:01 发布

阅读量516

点赞数 1

神经网络之前向传播

神经网络通过输入多个“单一”的神经元x₁,x₂,x₃，通过在隐含层的计算，输出你的期望（输出值）h_w,b(x)，当你的输入和输出是一样的时候，成为自编码模型(Auto-Encoder),而当你输入和输出是不一致的时候，也就是我们常说的人工神经网络。
在这里插入图片描述
注释：+1称为偏置节点，又称为截距（如同直线上的b）；

其中函数f:()称为激活函数，常用的激活函数为sigmoid函数和tanh函数

神经网络的计算

在这里插入图片描述

我们用 $x_{l}$ 表示网络的层数，本例中 $x_{l}$ =3 ，我们将第 $l$ 层记为 $L_{l}$ ，于是 $L_{1}$ 是输入层，输出层是 $L_{nl}$ 。本例神经网络有参数 $(W, b)$ = $W^{(1)}$ , $b^{(1)}$ , $W^{(2)}$ , $b^{(2)})$ ，其中 $W^{(l)}_{ij}$ （下面的式子中用到）是第 $l$ 层第 $j$ 单元与第 $l + 1$ 层第 $i$ 单元之间的联接参数（其实就是连接线上的权重，注意标号顺序）， $b^{(l)}_i$ 是第 $l + 1$ 层第 $i$ 单元的偏置项。因此在本例中， $W^{(1)} \in \Re^{3\times 3}$ ， $W^{(2)} \in \Re^{1\times 3}$ 。注意，没有其他单元连向偏置单元(即偏置单元没有输入)，因为它们总是输出 $+ 1$ 。同时，我们用 $s_l$ 表示第 $l$ 层的节点数（偏置单元不计在内）。

我们用 $a^{(l)}_i$ 表示第 $l$ 层第 $i$ 单元的激活值（输出值）。当 $l = 1$ 时， $a^{(1)}_i = x_i$ ，也就是第 $i$ 个输入值（输入值的第 $i$ 个特征）。对于给定参数集合 $W, b$ ，我们的神经网络就可以按照函数 $h_{W,b}(x)$ 来计算输出结果。本例神经网络的计算步骤如下：
在这里插入图片描述
我们用 $z^{(l)}_i$ 表示第 $l$ 层第 $i$ 单元输入加权和（包括偏置单元），比如， $z_i^{(2)} = \sum_{j=1}^n W^{(1)}_{ij} x_j + b^{(1)}_i ，则 \textstyle a^{(l)}_i = f(z^{(l)}_i)$ 。