6-三层神经网络与信号传递过程

最新推荐文章于 2023-06-16 13:37:41 发布

[小G]

最新推荐文章于 2023-06-16 13:37:41 发布

阅读量655

点赞数 1

分类专栏：神经网络|深度学习文章标签：神经网络 numpy

本文链接：https://blog.csdn.net/m0_46079750/article/details/107314602

版权

神经网络|深度学习专栏收录该内容

13 篇文章 1 订阅

订阅专栏

现在我们来进行神经网络的实现。这里我们以下图的3层神经网络为对象，实现从输入到输出的（前向）处理。在代码实现方面，使用上一节介绍的NumPy多维数组。巧妙地使用NumPy数组，可以用很少的代码完成神经网络的前向处理。

在这里插入图片描述

导入新符号

在这里插入图片描述

如图所示，权重和隐藏层的神经元的右上角有一个“(1)”，它表示权重和神经元的层号（即第1层的权重、第1层的神经元）。此外，权重的右下角有两个数字，它们是后一层的神经元和前一层的神经元的索引号

各层间信号传递的实现

在这里插入图片描述

用数学公式表示为：
$\begin{cases}a_1^{(1)}=\omega_{11}^{(1)}x_1+\omega_{12}^{(1)}x_2+b_1^{(1)}\\a_2^{(1)}=\omega_{21}^{(1)}x_1+\omega_{22}^{(1)}x_2+b_2^{(1)}\\a_3^{(1)}=\omega_{31}^{(1)}x_1+\omega_{32}^{(1)}x_2+b_3^{(1)}\end{cases}$
用矩阵表示为：
$\left[\begin{matrix}a_1^{(1)}\\a_2^{(1)}\\a_3^{(1)}\end{matrix}\right]=\left[\begin{matrix}\omega_{11}^{(1)}&\omega_{12}^{(1)}\\\omega_{21}^{(1)}&\omega_{22}^{(1)}\\\omega_{31}^{(1)}&\omega_{32}^{(1)}\end{matrix}\right]\times\left[\begin{matrix}x_1\\x_2\end{matrix}\right]+\left[\begin{matrix}b_1^{(1)}\\b_2^{(1)}\\b_3^{(1)}\end{matrix}\right]$
即：
$A^{(1)}=W^{(1)}X+B^{(1)}$
也可以写转置后的表达式：
$A^{(1)})^T=X^T (W^{(1)})^T + (B^{(1)})^T$
即：
$\left[\begin{matrix}a_1^{(1)}&a_2^{(1)}&a_3^{(1)}\end{matrix}\right]=\left[\begin{matrix}x_1&x_2\end{matrix}\right]\times\left[\begin{matrix}\omega_{11}^{(1)}&\omega_{21}^{(1)}&\omega_{31}^{(1)}\\\omega_{12}^{(1)}&\omega_{22}^{(1)}&\omega_{32}^{(1)}\end{matrix}\right]+\left[\begin{matrix}b_1^{(1)}&b_2^{(1)}&b_3^{(1)}\end{matrix}\right]$

下面用Numpy计算 A⁽¹⁾, 这里将输入信号、权重、偏置设置成任意值。

X = np.array([1.0, 0.5]) 
W1 = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]]) 
B1 = np.array([0.1, 0.2, 0.3])

print(W1.shape) # (2, 3)
print(X.shape)  # (2,)
print(B1.shape) # (3,)

A1 = np.dot(X, W1) + B1

接下来，将A⁽¹⁾ 代入激活函数 sigmoid（）转换成信号 Z⁽¹⁾

在这里插入图片描述

Z1 = sigmoid(A1)

print(A1) # [0.3, 0.7, 1.1] 
print(Z1) # [0.57444252, 0.66818777, 0.75026011

同理，可以描述第二第三层信号传递过程。

在这里插入图片描述

注意：

输出层所用的激活函数，要根据求解问题的性质决定。

一般地，回归问题可以使用恒等函数（如上图的 $\sigma()$ 函数），二元分类问题可以使用sigmoid函数，多元分类问题可以使用softmax函数。

最后，总代码如下：

def sigmoid(x): #激活函数
    return 1/(1+np.exp(-x)) 

def identity_function(x):  #恒等函数
    return x

def init_network():  #初始化参数
    network = {}  
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])   
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])   
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    return network

def forward(network, x):  #信号传递过程计算
    W1, W2, W3 = network['W1'], network['W2'], network['W3']  
    b1, b2, b3 = network['b1'], network['b2'], network['b3']
    a1 = np.dot(x, W1) + b1   
    z1 = sigmoid(a1)    
    a2 = np.dot(z1, W2) + b2   
    z2 = sigmoid(a2)  
    a3 = np.dot(z2, W3) + b3    
    y = identity_function(a3)
    return y

network = init_network() 
x = np.array([1, 0.5]) 
y = forward(network, x)

print(y)  #[0.31682708 0.69627909]

参考书籍：
深度学习入门：基于python的理论与实践 ——作者：斋藤康毅；译者：陆宇杰

[小G]

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
6-三层神经网络与信号传递过程

现在我们来进行神经网络的实现。这里我们以下图的3层神经网络为对象，实现从输入到输出的（前向）处理。在代码实现方面，使用上一节介绍的NumPy多维数组。巧妙地使用NumPy数组，可以用很少的代码完成神经网络的前向处理。导入新符号如图所示，权重和隐藏层的神经元的右上角有一个“(1)”，它表示权重和神经元的层号（即第1层的权重、第1层的神经元）。此外，权重的右下角有两个数字，它们是后一层的神经元和前一层的神经元的索引号各层间信号传递的实现用数学公式表示为：{a1(1)=ω11(1)x1+ω1
复制链接

扫一扫