【深度学习笔记（四）】之构造简单的神经网络

Harmony_Launch

已于 2022-07-31 11:54:40 修改

阅读量369

点赞数

分类专栏： # 深度学习文章标签：深度学习神经网络

于 2020-07-18 09:39:41 首次发布

本文链接：https://blog.csdn.net/Mrwxxxx/article/details/107424216

版权

深度学习专栏收录该内容

16 篇文章 5 订阅

订阅专栏

本文章由公号【开发小鸽】发布！欢迎关注！！！

老规矩–妹妹镇楼：

一. 构造三层的神经网络

（一）设定参数尺寸

设定激活函数为sigmoid函数。设定X输入数据，尺寸为 5 x 3，设定y输出标签，尺寸为 5 x 1。

三层神经网络，中间只有一层，有4个神经元。设定第一层为L0，中间层为L1，输出层为L2。

L0输入层的尺寸为 5 x 3
L0与L1之间的参数为w0，w0的尺寸为 3 x 4
L1中间层的尺寸为 5 x 4
L1与L2之间的参数为w1，w1的尺寸为 4 x 1
L2输出层的尺寸为 5 x 1

因此，可以得到3层神经网络的结构如下：

L0 -> w0 ->sigmoid -> L1 ->w1 -> sigmoid -> L2

（二）前向传播

前向传播从L0的x输入数据开始，

   L0 = x;
   L1 = sigmoid(w0x)
   L2 = sigmoid(w1L1)

（三）反向传播

反向传播要做的是不断优化参数w，通过计算各个样本对于误差的影响程度。

L2是最终输出，要与设定好的标签值y进行比较，误差值L2_error要越小越好。

L2_error = y – L2;

反向传播将误差L2_error首先从L2传到sigmoid函数，计算sigmoid函数的反求导操作，并且要乘上L2_error，因为L2_error决定了反向传播是否有必要。当L2_error很小时，说明结果与标签匹配的很好，那么反向传播就没有什么必要；当L2_error很大时，说明误差很大，需要大幅度地改进参数w，因此用L2_error来决定反向传播的力度。

L2_delta = L2_error * 反求导sigmoid;

L2_delta 求的是前面的样本对于误差有多大的影响。

之后的就是按照这种步骤，不断往前传。

（四）更新w参数

反向传播首先更新w1参数，因为L2是通过w1 * L1得到的，那么要求w1对于L2有多大影响，就对w1求导，得到L1，并乘以上一层传下来的L2_delta，L2_delta求的是前面的样本对于误差有多大影响。

w1 += L1…T.dot(L2_delta);

同理，对于w0，也是通过求导与乘以上层传下来的误差影响值

w0 += L0.T.dot(L1_delta)

最终w0, w1不断更新，使得误差值越来越小。

二. 代码：

import numpy as np


def sigmoid(x, deriv=False):
    """激活函数与反求导"""
    if(deriv==True):
        return x*(1-x)

    return 1 / (1 + np.exp(-x))

x = np.array([
    [0,0,1],
    [0,1,1],
    [1,0,1],
    [1,0,1],
    [1,0,1]
])
#print(x.shape)     5 x 3

y = np.array([
    [0],[1],[0],[1],[0]
])
#print(y.shape)      5 x 1

#随机数种子
np.random.seed(1)

#随机生成W参数
w0 = 2 * np.random.random((3,4)) -1
w1 = 2 * np.random.random((4,1)) -1
#print(w0.shape)    3 x 4
#print(w1.shape)    4 x 1

for i in range(600000):
    #求出三个层的数据
    l0 = x
    l1 = sigmoid(np.dot(l0, w0))
    l2 = sigmoid(np.dot(l1, w1))

    #l2层误差
    l2_error = y - l2

    #每隔10000次输出误差
    if i % 10000 == 0:
        print("Error" + str(np.mean(np.abs(l2_error))))

    #反向传播
    l2_delta = l2_error * sigmoid(l2, deriv=True)

    l1_error = l2_delta.dot(w1.T)

    l1_delta = l1_error * sigmoid(l1, deriv=True)

    #更新w 参数
    w1 += l1.T.dot(l2_delta)
    w0 += l0.T.dot(l1_delta)

Harmony_Launch

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【深度学习笔记（四）】之构造简单的神经网络

一. 构造三层的神经网络（一）设定参数尺寸       设定激活函数为sigmoid函数。设定X输入数据，尺寸为 5 x 3，设定y输出标签，尺寸为 5 x 1。       三层神经网络，中间只有一层，有4个神经元。设定第一层为L0，中间层为L1，输出层为L2。       L0输入层的尺寸为 5 x 3      &n
复制链接

扫一扫