9.2 简单RNN

bruceliangyong

已于 2024-03-17 07:16:07 修改

阅读量145

点赞数 3

文章标签： rnn 人工智能深度学习

于 2024-03-17 07:12:43 首次发布

本文链接：https://blog.csdn.net/angus168/article/details/136774472

版权

本文详细描述了如何使用简单循环神经网络来实现一个退位减法器，包括正向传播计算隐藏层和输出层的值，以及反向传播更新权重的过程。作者通过Python代码展示了整个训练过程和输出结果的验证。

摘要由CSDN通过智能技术生成

简单循环神经网络实现-----裸写一个退位减法器

正向传播和反向传播都开在开始的嵌套里面，不在“开始训练”，运行就没有输出了。

下面是全部代码

import copy,numpy as np
np.random.seed(0)     #固定随机数生成器的种子，可以每次得到一样的值
def sigmoid(x):       #激活函数
    output=1/(1+np.exp(-x))
    return output
def sigmoid_output_to_derivative(output):   #激活函数的导数
    return output*(1-output)
int2binary={}     #整数到其二进制表示的映射
binary_dim=8       #暂时制作256以内的减法
##计算0~256的二进制表示
largest_number=pow(2,binary_dim)
binary=np.unpackbits(
    np.array([range(largest_number)],dtype=np.uint8).T,axis=1)
for i in range(largest_number):
    int2binary[i]=binary[i]
#参数设置
alpha=0.9               #学习速率
input_dim=2             #输入的维度是2，减数和被减数
hidden_dim=16
output_dim=1            #输出维度为1
#初始化网络
synapse_0=(2*np.random.random((input_dim,hidden_dim))-1)*0.05
           #维度为2*16,2是输入维度，16是隐藏层维度
synapse_1=(2*np.random.random((hidden_dim,output_dim))-1)*0.05
synapse_h=(2*np.random.random((hidden_dim,hidden_dim))-1)*0.05
#=>[-0.05,0.05]
#用于存放反向传播的权重更新值
synapse_0_update=np.zeros_like(synapse_0)
synapse_1_update=np.zeros_like(synapse_1)
synapse_h_update=np.zeros_like(synapse_h)
#开始训练
for j in range(10000):
    #生成一个数据a
    a_int=np.random.randint(largest_number)
    #生成一个数字b,b的最大值取的是largest_number/2,作为被减数，让它小一点
    b_int=np.random.randint(largest_number/2)
    #如果生成的b大了，那么交换一下
    if a_int<b_int:
        tt=a_int
        b_int=a_int
        a_int=tt
    a=int2binary[a_int]     #二进制编码
    b=int2binary[b_int]     #二进制编码
    #正确的答案
    c_int=a_int-b_int
    c=int2binary[c_int]
    #存储神经网络的预测值
    d=np.zeros_like(c)
    overallError=0        #每次把总误差清零
    layer_2_deltas=list()     #存储每个时间点输出层的误差
    layer_1_values=list()     #存储每个时间点隐藏层的值
    layer_1_values.append(np.ones(hidden_dim)*0.1)
    #一开始没有隐藏层，所以初始化一下原始值为0.1
    #正向传播
    for position in range(binary_dim):
        #循环遍历每一个二进制位
        #生成输入和输出
        X=np.array([[a[binary_dim-position-1],b[binary_dim-position-1]]])
        #从右到左，每次取两个输入数字的一个bit位
        y=np.array([[c[binary_dim-position-1]]]).T  #正确答案
        #hidden layer(input ~+ prev_hidden)
        layer_1=sigmoid(np.dot(X,synapse_0)+np.dot(layer_1_values[-1],synapse_h)) #（输入层+
        #之前的隐藏层）->新的隐藏层，这是体现循环神经网络的最核心的地方
        #output layer (new binary representation)
        layer_2=sigmoid(np.dot(layer_1,synapse_1))
        #隐藏层*隐藏层到输出层的转化矩阵synapse_1->输出层
        layer_2_error=y-layer_2     #预测误差
        layer_2_deltas.append((layer_2_error)*sigmoid_output_to_derivative(layer_2))  #把每一个时间点的误差导数都记录下来
        overallError+=np.abs(layer_2_error[0])  #总误差
        d[binary_dim-position-1]=np.round(layer_2[0][0])  #记录下每一个预测bit位
        #隐藏层保存起来。下个时间序列便可以使用
        layer_1_values.append(copy.deepcopy(layer_1))
        #记录下隐藏层的值，在下一个时间点用
        future_layer_l_delta=np.zeros(hidden_dim)

    #反向传播，从最后一个时间点到第一个时间点
    for position in range(binary_dim):
        X=np.array([[a[position],b[position]]])  #最后一次的两输入
        layer_1=layer_1_values[-position-1]  #当前时间点的隐藏层
        prev_layer_1=layer_1_values[-position-2]
        layer_2_delta=layer_2_deltas[-position-1]  #当前时间点输出层导数
        #通过后一个时间点（因为是反向传播）的隐藏层误差和当前时间点的输出层误差，计算当前时间点的隐藏误差
        layer_1_delta=(future_layer_l_delta.dot(synapse_h.T)+layer_2_delta.dot(synapse_1.T))*sigmoid_output_to_derivative(layer_1)
        #等完成了所有反向传播误差计算，才会更新权重矩阵，先暂时把更新矩阵存起来
        synapse_1_update+=np.atleast_2d(layer_1).T.dot(layer_2_delta)
        synapse_h_update+=np.atleast_2d(prev_layer_1).T.dot(layer_1_delta)
        synapse_0_update+=X.T.dot(layer_1_delta)
        future_layer_l_delta=layer_1_delta
        #完成所有反向传播之后，更新权重矩阵，并把矩阵变量清零
        synapse_0+=synapse_0_update*alpha
        synapse_1+=synapse_1_update*alpha
        synapse_h+=synapse_h_update*alpha
        synapse_0_update*=0
        synapse_1_update*=0
        synapse_h_update*=0
    #打印输出过程
    if(j%1000==0):
        print("总误差："+str(overallError))
        print("Pred:"+str(d))
        print("True:"+str(c))
        out=0
        for index,x in enumerate(reversed(d)):
            out+=x*pow(2,index)
        print(str(a_int)+"+"+str(b_int)+"="+str(out))
        print("---------------")