Python时间序列LSTM预测系列学习笔记（7）-多变量

最新推荐文章于 2024-08-13 15:48:31 发布

日拱一两卒

最新推荐文章于 2024-08-13 15:48:31 发布

阅读量2.7k

点赞数 1

分类专栏： LSTM预测从入门到实战

本文链接：https://blog.csdn.net/yangwohenmai1/article/details/84068777

版权

LSTM预测从入门到实战专栏收录该内容

11 篇文章 65 订阅

订阅专栏

本文是对：

https://machinelearningmastery.com/multivariate-time-series-forecasting-lstms-keras/

https://blog.csdn.net/iyangdi/article/details/77877410

两篇博文的学习笔记，两个博主笔风都很浪，有些细节一笔带过，本人以谦逊的态度进行了学习和整理，笔记内容都在代码的注释中。有不清楚的可以去原博主文中查看。

数据集下载：https://raw.githubusercontent.com/jbrownlee/Datasets/master/pollution.csv

后期我会补上我的github

源码地址：https://github.com/yangwohenmai/LSTM/tree/master/LSTM%E7%B3%BB%E5%88%97/LSTM%E5%A4%9A%E5%8F%98%E9%87%8F1

从这节开始，开始学习多变量的LSTM预测

把数据先下载下来，预处理一下，用图像把数据显示出来

1、下载下载的数据删掉没有用的列，把每一列都重新命名

# coding=utf-8

from pandas import read_csv
from pandas import datetime


def parser(x):
    return datetime.strptime(x, '%Y %m %d %H')

#加载数据
dataset = read_csv('data_set/air_pollution.csv', parse_dates=[['year', 'month', 'day', 'hour']], index_col=0,
                   date_parser=parser)
# axis=1,表示删除列；inplace=True,直接在原DataFrame上执行删除
dataset.drop('No', axis=1, inplace=True)

# 手动设置每一列的label
dataset.columns = ['pollution', 'dew', 'temp', 'press', 'wnd_dir', 'wnd_spd', 'snow', 'rain']
dataset.index.name = 'date'
# 将NA替换为0
dataset['pollution'].fillna(0, inplace=True)
# 删除最开始的24条数据
dataset = dataset[24:]
print (dataset.head())

# 保存处理后数据
dataset.to_csv('data_set/air_pollution_new.csv')

2、把处理后的数据用matplotlib画出来观赏观赏

# coding=utf-8
# 输出数据曲线
# ------------
from pandas import read_csv
from matplotlib import pyplot

dataset = read_csv('data_set/air_pollution_new.csv', header=0, index_col=0)
values = dataset.values

# 需要输出的列，创建一个数组，[0,1,2,3,4,5,6,7]
groups = [i for i in range(8)]
groups.remove(4)  # 删除数组中的值4，因为第四列是字符串，删除后的数组是[0,1,2,3,5,6,7]

i = 1
# 输出列曲线图
pyplot.figure()
#循环画出values的每一列数据
for group in groups:
    pyplot.subplot(len(groups), 1, i)  # 创建len(gourps)行，1列的子图，表示在第i个子图画图
    pyplot.plot(values[:, group])#画出values中第group列的数据
    pyplot.title(dataset.columns[group], y=0.5, loc='right')
    i += 1
pyplot.show()