一、概念
循环神经网络(Recurrent Neural Network,RNN):
它能结合数据点之间的特定顺序和幅值大小等多个特征,来处理序列数据。更重要的是输入序列可以是任意长度的。
RNNs的目的是用来处理序列数据。在传统的神经网络模型中,是从输入层到隐含层再到输出层,层与层之间是全连接的,每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题却无能为力。例如,你要预测句子的下一个单词是什么,一般需要用到前面的单词,因为一个句子中前后单词并不是独立的。RNN之所以称为循环神经网络,即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中,即隐藏层之间的节点不再无连接而是有连接的,并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。下图便是一个典型的RNN:
二、代码
- from tensorflow.examples.tutorials.mnist import input_data
- mnist = input_data.read_data_sets("MNIST_data/",one_hot=True)
- import tensorflow as tf
- import numpy as np
- from tensorflow.contrib import rnn
- '''''
- MNIST的数据是一个28*28的图像,这里RNN测试,把他看成一行行的序列(28维度(28长的sequence)*28行)
- '''
- # RNN学习时使用的参数
- learning_rate = 0.001
- training_iters = 100000
- batch_size = 128
- display_step = 10
- # 神经网络的参数
- n_input = 28 # 输入层的n
- n_steps = 28 # 28长度
- n_hidden = 128