今天开始研究keras与LSTM,到底是怎么编程实现的;
LSTM参数量计算公式为:
4×【(input_size+hidden_size) * hidden_size + hidden_size(这是偏置的数量=隐藏层节点)】
LSTM有四个门,因此参数量为4 * [ ]这些;每个门里面计算的参数量为
LSTM 的输入必须是三维的。我们可以将 2D 序列重塑为具有 5 个样本、1 个时间步和 1 个特征的 3D 序列。我们将输出定义为具有 1 个特征的 5 个样本。
先实现一个demo 五个样本的预测—Sequential编程
from numpy import array
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
# 准备序列数据
length = 5
seq = array([i/float(length) for i in range(length)])
# seq = [0.0,0.2,0.4,0.6,0.8]
X = seq.reshape(len(seq),1,1)
y = seq.reshape(len(seq),1) #reshape修改了原有矩阵大小
# 定义LSTM配置
n_neurons = length # LSTM神经元数量
n_batch = length # LSTM每批次训练的样本数量
n_epoch = 1000 # LSTM迭代的次数
# 创建LSTM
model = Sequential()
model.add(LSTM(n_neurons, input_shape=(1, 1)))
model.add(Dense(1))
model.compile(loss='mean_squared_error',optimizer='adam')
print(model.summary())
# 训练LSTM
model.fit(X,y,epochs=n_epoch,batch_size=n_batch,verbose=2)
# 评估
result = model.predict(X,batch_size=n_batch,verbose=0)
for value in result:
print('%.1f' %value)
实现一个demo 五个样本的预测—函数式API编程
from numpy import array
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import LSTM
from keras.models import Model
from keras import Input
# 准备序列数据
length = 5
seq = array([i/float(length) for i in range(length)])
# seq = [0.0,0.2,0.4,0.6,0.8]
X = seq.reshape(len(seq),1,1)
y = seq.reshape(len(seq),1) #reshape修改了原有矩阵大小
# 定义LSTM配置
n_neurons = length # LSTM神经元数量
n_batch = length # LSTM每批次训练的样本数量
n_epoch = 1000 # LSTM迭代的次数
# 创建LSTM
model_input = Input(shape=(1,1))
LSTM1 = LSTM(n_neurons)(model_input)
pred = Dense(1)(LSTM1)
model = Model(model_input,pred)
model.compile(loss='mean_squared_error',optimizer='adam')
print(model.summary())
# 训练LSTM
model.fit(X,y,epochs=n_epoch,batch_size=n_batch,verbose=2)
# 评估
result = model.predict(X,batch_size=n_batch,verbose=0)
for value in result:
print('%.1f' %value)
代码里面的编程问题
函数括号里面最后放**kwargs什么意思
总结:**kwargs 这样形式的参数是Python中一种常用的语法,用于处理任意数量的关键字参数,并将其作为字典传递给函数或方法。
Call arguments:
LSTM里面没有input_shape这个参数,之所以可以这么赋值,参考如下链接
keras.layers传递"input_shape"参数给第一层
model.fit 和model.evaluate 中的 verbose的用法相同
verbose:日志显示
verbose = 0 为不在标准输出流输出日志信息
verbose = 1 为输出进度条记录
verbose = 2 没有进度条,只是输出一行记录
后续一个小时要研究keras的TimeDistributed,实现分布式训练。