lstm python_python – LSTM – 对部分序列进行预测

最新推荐文章于 2024-03-28 17:49:36 发布

weixin_39793794

最新推荐文章于 2024-03-28 17:49:36 发布

阅读量233

点赞数

文章标签： lstm python

本文链接：https://blog.csdn.net/weixin_39793794/article/details/111819854

版权

本文介绍了使用 Python 和 LSTM 模型进行二分类预测的问题。模型在训练时非状态化，预测时状态化，以处理序列数据。作者遇到的问题是，当逐个样本进行预测时，概率输出不稳定，期望连续样本的概率能连续变化。尝试通过让 LSTM 返回序列的隐藏状态来改进，但遇到了维度不匹配的错误。现在寻求解决方案以改善预测的连续性。

摘要由CSDN通过智能技术生成

我已经训练了一个LSTM模型来预测100个样本的批次的二进制类(1或0),每个样本有3个特征,即：数据的形状是(m,100,3),其中m是批次的数量.

数据：

[

[[1,2,3],[1,3]... 100 sampels],[[1,... avaialble batches in the training data

]

目标：

[

[1]

[0]

...

]

型号代码：

def build_model(num_samples,num_features,is_training):

model = Sequential()

opt = optimizers.Adam(lr=0.0005,beta_1=0.9,beta_2=0.999,epsilon=1e-08,decay=0.0001)

batch_size = None if is_training else 1

stateful = False if is_training else True

first_lstm = LSTM(32,batch_input_shape=(batch_size,num_samples,num_features),return_sequences=True,activation='tanh',stateful=stateful)

model.add(first_lstm)

model.add(LeakyReLU())

model.add(Dropout(0.2))

model.add(LSTM(16,stateful=stateful))

model.add(Dropout(0.2))

model.add(LeakyReLU())

model.add(LSTM(8,return_sequences=False,stateful=stateful))

model.add(LeakyReLU())

model.add(Dense(1,activation='sigmoid'))

if is_training:

model.compile(loss='binary_crossentropy',optimizer=opt,metrics=['accuracy',keras_metrics.precision(),keras_metrics.recall(),f1])

return model

对于训练阶段,模型不是有状态的.在预测我正在使用有状态模型时,迭代数据并输出每个样本的概率：

for index,row in data.iterrows():

if index % 100 == 0:

predicting_model.reset_states()

vals = np.array([[row[['a','b','c']].values]])

prob = predicting_model.predict_on_batch(vals)

当查看批处理结束时的概率时,它正是我用整个批处理预测时得到的值(不是一个接一个).但是,我预计当新样本到达时,概率将始终在正确的方向上继续.实际发生的是,概率输出可能会在任意样本上出现错误的类别(见下文).

预测时100个样品批次的两个样品(标签= 1)：

和Label = 0：

有没有办法实现我想要的(避免极端尖峰,同时预测概率),或者这是一个给定的事实？

任何解释,建议将不胜感激.

更新

感谢@today建议,我尝试使用最后一个LSTM层上的return_sequence = True为每个输入时间步骤训练网络隐藏状态输出.

所以现在标签看起来像这样(形状(100,100))：

[[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0]

[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]

...]

模型摘要：

Layer (type) Output Shape Param #

=================================================================

lstm_1 (LSTM) (None,32) 4608

_________________________________________________________________

leaky_re_lu_1 (LeakyReLU) (None,32) 0

_________________________________________________________________

dropout_1 (Dropout) (None,32) 0

_________________________________________________________________

lstm_2 (LSTM) (None,16) 3136

_________________________________________________________________

dropout_2 (Dropout) (None,16) 0

_________________________________________________________________

leaky_re_lu_2 (LeakyReLU) (None,16) 0

_________________________________________________________________

lstm_3 (LSTM) (None,8) 800

_________________________________________________________________

leaky_re_lu_3 (LeakyReLU) (None,8) 0

_________________________________________________________________

dense_1 (Dense) (None,1) 9

=================================================================

Total params: 8,553

Trainable params: 8,553

Non-trainable params: 0

_________________________________________________________________

但是,我得到一个例外：

ValueError: Error when checking target: expected dense_1 to have 3 dimensions,but got array with shape (75,100)

我需要修理什么？

weixin_39793794

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
lstm python_python – LSTM – 对部分序列进行预测

我已经训练了一个LSTM模型来预测100个样本的批次的二进制类(1或0),每个样本有3个特征,即：数据的形状是(m,100,3),其中m是批次的数量.数据：[[[1,2,3],[1,3]... 100 sampels],[[1,... avaialble batches in the training data]目标：[[1][0]...]型号代码：def build_model(num_samp...
复制链接

扫一扫