5-隐藏层：神经网络为什么working_隐藏层神经网络-CSDN博客

# 第一层
# 第一个神经元
w11_1 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
b1_1 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项

# 第二个神经元
w12_1 = np.random.rand() # _后表示第几层，12表示第1个输入和第2个神经元
b2_1 = np.random.rand() # _后表示第几层，2表示第二个神经元权重的偏置项

（二）上一层的输出结果与第二层

# 第二层
w11_2 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
w21_2 = np.random.rand() # _后表示第几层，21表示第2个输入和第1个神经元
b1_2 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项

（三）计算前向传播

# 计算前向传播
# 第一层
z1_1 = w11_1 * xs + b1_1
a1_1 = sigmoid(z1_1)
z2_1 = w21_1 * xs + b2_1
a2_1 = sigmoid(z2_1)

# 第二层
# 第一层的输出作为输入
z1_2 = w11_2 * a1_1 + w21_2 * a2_1 + b1_2
a1_2 = sigmoid(z1_2)

（四）计算反向传播

# 先来一次前向传播
z1_1, a1_1, z2_1, a2_1, z1_2, a1_2 = forward_propagation(x)
# 反向传播
# 代价函数e
e = (y - a1_2)**2

# 代价函数对最终输出求导
deda1_2 = -2 * (y - a1_2)
# 第二层神经元的激活函数求导
da1_2dz1_2 = a1_2 * (1 - a1_2)
# z1_2对两个输入神经元的权重求导，即线性函数的导数
dz1_2dw11_2 = a1_1
dz1_2dw21_2 = a2_1
# 链式法则，得到损失函数e对第二层神经元的两个输入的导数
dedw11_2 = deda1_2 * da1_2dz1_2 * dz1_2dw11_2
dedw21_2 = deda1_2 * da1_2dz1_2 * dz1_2dw21_2
# 第二层神经元的偏置项
dz1_2db1_2 = 1
dedb1_2 = deda1_2 * da1_2dz1_2 *dz1_2db1_2

# 对隐藏层的神经元进行操作
# 第一个神经元
# 对权重求导
dz1_2da1_1 = w11_2
# 激活函数求导
da1_1dz1_1 = a1_1 * (1 - a1_1)
# 对权重求导
dz1_1dw11_1 = x
# 链式法则
dedw11_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1dw11_1
# 对偏置项b求导
dz1_1db1_1 = 1
# 链式求导法则
dedb1_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1db1_1

# 对第二个神经元
# 对权重求导
dz1_2da2_1 = w21_2
# 激活函数求导
da2_1dz2_1 = a2_1 * (1 - a2_1)
# 对权重求导
dz2_1dw12_1 = x
dedw12_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1dw12_1
# 对偏置项b求导
dz2_1db2_1 = 1
# 链式求导法则
dedb2_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1db2_1

alpha = 0.03
# 更新参数
w11_1 = w11_1 - alpha * dedw11_1
w12_1 = w12_1 - alpha * dedw12_1
b1_1 = b1_1 - alpha * dedb1_1

w11_2 = w11_2 - alpha * dedw11_2
w21_2 = w21_2 - alpha * dedw21_2
b1_2 = b1_2 - alpha * dedb1_2

（五）完整代码

import dataset
import matplotlib
import numpy as np
from matplotlib import pyplot as plt
# 首先要知道 matplotlib 的 backend 使用的是默认配置 agg （agg不能显示绘制的图），要想显示绘制的图需要更改 agg 为 TkAgg
matplotlib.use('TkAgg')

def sigmoid(x):
    return 1 / (1 + np.exp(-x))

# 生成数据
xs, ys = dataset.get_beans(100)
num = 100

# 第一层
# 第一个神经元
w11_1 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
b1_1 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项
# 第二个神经元
w12_1 = np.random.rand() # _后表示第几层，12表示第1个输入和第2个神经元
b2_1 = np.random.rand() # _后表示第几层，2表示第二个神经元权重的偏置项

# 第二层
w11_2 = np.random.rand() # _后表示第几层，11表示第1个输入和第1个神经元
w21_2 = np.random.rand() # _后表示第几层，21表示第2个输入和第1个神经元
b1_2 = np.random.rand() # _后表示第几层，1表示第一个神经元权重的偏置项

# 计算前向传播
def forward_propagation(xs):
    # 第一层
    z1_1 = w11_1 * xs + b1_1
    a1_1 = sigmoid(z1_1)
    z2_1 = w12_1 * xs + b2_1
    a2_1 = sigmoid(z2_1)

    # 第二层
    # 第一层的输出作为输入
    z1_2 = w11_2 * a1_1 + w21_2 * a2_1 + b1_2
    a1_2 = sigmoid(z1_2)

    return z1_1, a1_1, z2_1, a2_1, z1_2, a1_2



# 在全部样本上做了5000次梯度下降
for _ in range(5000):
    for i in range(100):
        # 随机梯度下降算法，以单个为对象
        x = xs[i]
        y = ys[i]
        # 先来一次前向传播
        z1_1, a1_1, z2_1, a2_1, z1_2, a1_2 = forward_propagation(x)
        # 反向传播
        # 代价函数e
        e = (y - a1_2)**2

        # 代价函数对最终输出求导
        deda1_2 = -2 * (y - a1_2)
        # 第二层神经元的激活函数求导
        da1_2dz1_2 = a1_2 * (1 - a1_2)
        # z1_2对两个输入神经元的权重求导，即线性函数的导数
        dz1_2dw11_2 = a1_1
        dz1_2dw21_2 = a2_1
        # 链式法则，得到损失函数e对第二层神经元的两个输入的导数
        dedw11_2 = deda1_2 * da1_2dz1_2 * dz1_2dw11_2
        dedw21_2 = deda1_2 * da1_2dz1_2 * dz1_2dw21_2
        # 第二层神经元的偏置项
        dz1_2db1_2 = 1
        dedb1_2 = deda1_2 * da1_2dz1_2 *dz1_2db1_2

        # 对隐藏层的神经元进行操作
        # 第一个神经元
        # 对权重求导
        dz1_2da1_1 = w11_2
        # 激活函数求导
        da1_1dz1_1 = a1_1 * (1 - a1_1)
        # 对权重求导
        dz1_1dw11_1 = x
        # 链式法则
        dedw11_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1dw11_1
        # 对偏置项b求导
        dz1_1db1_1 = 1
        # 链式求导法则
        dedb1_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da1_1dz1_1 * dz1_1db1_1

        # 对第二个神经元
        # 对权重求导
        dz1_2da2_1 = w21_2
        # 激活函数求导
        da2_1dz2_1 = a2_1 * (1 - a2_1)
        # 对权重求导
        dz2_1dw12_1 = x
        dedw12_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1dw12_1
        # 对偏置项b求导
        dz2_1db2_1 = 1
        # 链式求导法则
        dedb2_1 = deda1_2 * da1_2dz1_2 * dz1_2da1_1 * da2_1dz2_1 * dz2_1db2_1

        alpha = 0.03
        w11_1 = w11_1 - alpha * dedw11_1
        w12_1 = w12_1 - alpha * dedw12_1
        b1_1 = b1_1 - alpha * dedb1_1

        w11_2 = w11_2 - alpha * dedw11_2
        w21_2 = w21_2 - alpha * dedw21_2
        b1_2 = b1_2 - alpha * dedb1_2

    # 减少绘图的频率
    if _ % 50 == 0:
        # plt.clf()函数清除绘图窗口
        plt.clf()
        # 重新绘制散点图和预测曲线
        plt.scatter(xs, ys)
        z1_1, a1_1, z2_1, a2_1, z1_2, a1_2 = forward_propagation(xs)
        plt.plot(xs, a1_2)

        # 暂停0.01秒
        plt.pause(0.01)