深度学习理论向应用的过渡课程【北京大学_TensorFlow2.0笔记】学习笔记（十一）——RNN介绍及字母预测

m0_58586235

已于 2022-03-20 19:58:12 修改

阅读量1.1k

点赞数 1

分类专栏：北京大学TensorFlow 文章标签： tensorflow 神经网络深度学习

于 2022-03-19 10:32:22 首次发布

本文链接：https://blog.csdn.net/m0_58586235/article/details/123589260

版权

北京大学TensorFlow 专栏收录该内容

12 篇文章 3 订阅

订阅专栏

循环核：参数时间共享，循环层提取时间信息

具有记忆力，通过不同时刻的参数共享，实现了对时间序列的信息提取

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

yt ：当前时刻循环核的输出特征——求解过程为一个全连接层

ht ：记忆体当前时刻存储的状态信息

ht-1：记忆体上一时刻存储的状态信息

bh、by：偏置项

训练优化的就是这些参数矩阵，训练完成后，使用效果最好的参数矩阵执行前向传播，输出预测结果。

循环神经网络：借助循环核提取时间特征后，送入全连接网络

借助全连接网络，实现连续数据预测。

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

循环计算层：向输出方向生长

每个循环核构成一层循环计算层

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16

TF描述循环计算层

tf.keras.layers.SimpleRNN(记忆体个数, activation='激活函数',
                         return_sequences = 是否每个时刻输出ht到下一层)

activation = '激活函数' #不写默认tanh

return_sequences = True     #各时间步输出ht，常在中间层循环核使用
return_sequences = False    #仅最后时间步输出ht（默认），常在最后一层循环核使用

例如：SimpleRNN(3, return_sequence=True)

循环核在每个时间步输出ht可用下图表示

watermark,type_d3F5LXplbmhlaQ,shadow_50,text_Q1NETiBAbTBfNTg1ODYyMzU=,size_20,color_FFFFFF,t_70,g_se,x_16