LSMT 实战-python

长短期记忆网络(LSTM,Long Short-Term Memory)

使用kears 搭建一个LSTM预测模型,使用2022年美国大学生数学建模大赛中C题中处理后的BTC比特币的数据进行数据训练和预测。

这篇博客包含两个预测,一种是使用前N天的数据预测后一天的数据,一种使用前N天的数据预测后N天的数据

第一种:使用前个三十天数据进行预测后一天的数据。

总数据集:1826个数据
数据下载地址:需要的可以自行下载,很快
  • 链接:https://pan.baidu.com/s/1TmQxLfzHiyOL3vEVcuWlgQ
  • 提取码:wy0f
模型结构
Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
lstm (LSTM)                  (None, 30, 64)            16896     
_________________________________________________________________
lstm_1 (LSTM)                (None, 30, 128)           98816     
_________________________________________________________________
lstm_2 (LSTM)                (None, 32)                20608     
_________________________________________________________________
dropout (Dropout)            (None, 32)                0         
_________________________________________________________________
dense (Dense)                (None, 1)                 33        
=================================================================
Total params: 136,353
Trainable params: 136,353
Non-trainable params: 0
_________________________________________________________________
训练100次:

image

损失函数图像:

点击链接前往
image

预测和真实值比较,可以看到效果并不是很好,这个需要自己调参进行变化

image

  • 我的GPU加速时1650还挺快,7.5算力,训练时间可以接受
    image
代码:
# 调用库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras import layers
from sklearn.preprocessing import MinMaxScaler


#### 数据处理部分 ####

# 读入数据
data = pd.read_excel('BTCtest.xlsx')


# 时间戳长度
time_step = 30 # 输入序列长度

print(len(data))
# 划分训练集与验证集
data = data[['Value']]
train = data[0:1277]
valid = data[1278:1550]
test = data[1551:]



# 归一化
scaler = MinMaxScaler(feature_range=(0, 1))

# datas 切片数据 time_step要输入的维度 pred 预测维度
def scalerClass(datas,scaler,time_step,pred):
    x, y = [], []

    scaled_data = scaler.fit_transform(datas)

    for i in range(time_step, len(datas) - pred):
        x.append(scaled_data[i - time_step:i])
        y.append(scaled_data[i: i + pred])

    # 把x_train转变为array数组
    x, y = np.array(x), np.array(y).reshape(-1, 1)  # reshape(-1,5)的意思时不知道分成多少行,但是是五列
    return x,y



# 训练集 验证集 测试集 切片
x_train,y_train = scalerClass(train,scaler,time_step=time_step,pred=1)
x_valid, y_valid = scalerClass(valid,scaler,time_step=time_step,pred=1)
x_test, y_test = scalerClass(test,scaler,time_step=time_step,pred=1)



#### 建立神经网络模型 ####
model = keras.Sequential()
model.add(layers.LSTM(64, return_sequences=True, input_shape=(x_train.shape[1:])))
model.add(layers.LSTM(128, return_sequences=True))
model.add(layers.LSTM(32))
model.add(layers.Dropout(0.3))
model.add(layers.Dense(1))


# model.compile(optimizer = 优化器,loss = 损失函数, metrics = ["准确率”])
#  “adam"  或者  tf.keras.optimizers.Adam(lr = 学习率,decay = 学习率衰减率)
# ”mse" 或者 tf.keras.losses.MeanSquaredError()
model.compile(optimizer=keras.optimizers.Adam(), loss='mse',metrics=['accuracy'])


# monitor:要监测的数量。
# factor:学习速率降低的因素。new_lr = lr * factor
# patience:没有提升的epoch数,之后学习率将降低。
# verbose:int。0:安静,1:更新消息。
# mode:{auto,min,max}之一。在min模式下,当监测量停止下降时,lr将减少;在max模式下,当监测数量停止增加时,它将减少;在auto模式下,从监测数量的名称自动推断方向。
# min_delta:对于测量新的最优化的阀值,仅关注重大变化。
# cooldown:在学习速率被降低之后,重新恢复正常操作之前等待的epoch数量。
# min_lr:学习率的下限
learning_rate= keras.callbacks.ReduceLROnPlateau(monitor='val_loss', patience=3, factor=0.7, min_lr=0.00000001)

#显示模型结构
model.summary()
# 训练模型
history = model.fit(x_train, y_train,
                    batch_size = 128,
                    epochs=100,
                    validation_data=(x_valid, y_valid),
                    callbacks=[learning_rate])

# loss变化趋势可视化
plt.title('LSTM loss figure')
plt.plot(history.history['loss'],label='training loss')
plt.plot(history.history['val_loss'], label='val loss')
plt.legend(loc='upper right')
plt.show()



#### 预测结果分析&可视化 ####

# 输入测试数据,输出预测结果
y_pred = model.predict(x_test)
# 输入数据和标签,输出损失和精确度
model.evaluate(x_test)
scaler.fit_transform(pd.DataFrame(valid['Value'].values))



# 反归一化
y_pred = scaler.inverse_transform(y_pred.reshape(-1,1)[:,0].reshape(1,-1)) #只取第一列
y_test = scaler.inverse_transform(y_test.reshape(-1,1)[:,0].reshape(1,-1))





# 预测效果可视化

plt.figure(figsize=(16, 8))
plt.title('Predicted and real')
dict = {
    'Predictions': y_pred[0],
    'Value': y_test[0]
}
data_pd = pd.DataFrame(dict)
plt.plot(data_pd[['Value']],linewidth=3,alpha=0.8)
plt.plot(data_pd[['Predictions']],linewidth=1.2)
#plt.savefig('lstm.png', dpi=600)
plt.show()




预测后几天的数据和预测后一天原理是一样的
  • 因为预测的是5天的数据所以不能使用图像显示出来,只能取出预测五天的头一天的数据进行绘图。数据结构可以打印出来的,我没有反归一化,需要的时候再弄把
  • 前五十天预测五天的代码:
# 调用库 
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from tensorflow import keras
from tensorflow.keras import layers
from sklearn.preprocessing import MinMaxScaler

# 读入数据
data = pd.read_excel('BTCtest.xlsx')

time_step = 50 # 输入序列长度


# 划分训练集与验证集
data = data[['Value']]
train = data[0:1277]  #70%
valid = data[1278:1550] #15%
test = data[1551:] #15%

# 归一化
scaler = MinMaxScaler(feature_range=(0, 1))

# 定义一个切片函数
# datas 切片数据 time_step要输入的维度 pred 预测维度
def scalerClass(datas,scaler,time_step,pred):
    x, y = [], []

    scaled_data = scaler.fit_transform(datas)

    for i in range(time_step, len(datas) - pred):
        x.append(scaled_data[i - time_step:i])
        y.append(scaled_data[i: i + pred])

    # 把x_train转变为array数组
    x, y = np.array(x), np.array(y).reshape(-1, 5)  # reshape(-1,5)的意思时不知道分成多少行,但是是五列
    return x,y

# 训练集 验证集 测试集 切片
x_train,y_train = scalerClass(train,scaler,time_step=time_step,pred=5)
x_valid, y_valid = scalerClass(valid,scaler,time_step=time_step,pred=5)
x_test, y_test = scalerClass(test,scaler,time_step=time_step,pred=5)


# 建立网络模型
model = keras.Sequential()
model.add(layers.LSTM(64, return_sequences=True, input_shape=(x_train.shape[1:])))
model.add(layers.LSTM(64, return_sequences=True))
model.add(layers.LSTM(32))
model.add(layers.Dropout(0.1))
model.add(layers.Dense(5))

model.compile(optimizer=keras.optimizers.Adam(), loss='mse',metrics=['accuracy'])
learning_rate_reduction = keras.callbacks.ReduceLROnPlateau(monitor='val_loss', patience=3, factor=0.7, min_lr=0.000000005)

model.summary()
history = model.fit(x_train, y_train,
                    batch_size = 128,
                    epochs=30,
                    validation_data=(x_valid, y_valid),
                    callbacks=[learning_rate_reduction])

# loss变化趋势可视化
plt.title('LSTM loss figure')
plt.plot(history.history['loss'],label='training loss')
plt.plot(history.history['val_loss'], label='val loss')
plt.legend(loc='upper right')
plt.show()

#### 预测结果分析&可视化 ####

y_pred = model.predict(x_test)
model.evaluate(x_test)
scaler.fit_transform(pd.DataFrame(valid['Value'].values))

print(y_pred)
print(y_test)

# 预测效果可视化
# 反归一化
y_pred = scaler.inverse_transform(y_pred.reshape(-1,5)[:,0].reshape(1,-1)) #只取第一列
y_test = scaler.inverse_transform(y_test.reshape(-1,5)[:,0].reshape(1,-1))

plt.figure(figsize=(16, 8))
plt.title('Predicted and real')
dict_data = {
    'Predictions': y_pred.reshape(1,-1)[0],
    'Value': y_test[0]
}
data_pd = pd.DataFrame(dict_data)
plt.plot(data_pd[['Value']],linewidth=3,alpha=0.8)
plt.plot(data_pd[['Predictions']],linewidth=1.2)
plt.savefig('lstm.png', dpi=600)
plt.show()

感谢关注与支持!

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
LSMT是长短期记忆神经网络(Long Short-Term Memory,LSTM)的简称。它是一种特殊的循环神经网络(Recurrent Neural Network,RNN),用于处理具有长期依赖关系的序列数据。 Matlab是一种广泛应用于科学计算和工程领域的高级编程语言和环境。它提供了用于算法开发、数据可视化、数值计算和模型仿真等方面的丰富工具。 将LSMT和Matlab结合使用,可以更方便地进行序列数据的建模和预测。在Matlab中,我们可以使用深度学习工具箱来构建和训练LSTM模型。通过导入和处理序列数据,我们可以利用LSTM模型来分析序列数据中的模式和趋势,并进行未来值的预测。 在构建LSTM模型时,Matlab提供了一系列用于处理时间序列数据的函数和工具,如sequenceInputLayer、lstmLayer和fullyConnectedLayer等。我们可以通过配置这些层的参数,来调整LSTM模型的结构和特性,以适应不同的序列数据特征。 使用LSTM模型进行预测时,我们首先需要将数据按照时间顺序进行划分,并将其输入到LSTM网络中。然后,通过训练网络,我们可以获得模型对未来数值的预测结果。最后,我们可以使用Matlab提供的数据可视化工具,将预测结果以图表的形式展示出来,以便更好地理解序列数据的发展趋势。 综上所述,LSMT和Matlab的结合使用可以方便地进行序列数据的建模和预测。通过Matlab提供的深度学习工具箱,我们可以构建、训练和优化LSTM模型,进而分析序列数据并进行未来值的预测。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

H `K

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值