keras进行时间序列预测

最新推荐文章于 2024-06-17 17:43:36 发布

格拉迪沃

最新推荐文章于 2024-06-17 17:43:36 发布

阅读量6k

点赞数 6

分类专栏： keras学习

本文链接：https://blog.csdn.net/qq_32796253/article/details/88935756

版权

本文通过深度学习方法预测时间序列数据，以德国气象站记录的气温为例，介绍了数据预处理、基准方法、模型搭建及调优。采用GRU模型，通过增加dropout层和网络深度来防止过拟合，探讨了时间序列转化为监督学习问题的关键步骤。

摘要由CSDN通过智能技术生成

时间序列预测

概述
数据集的预处理
基准方法
调优
- 增加dropout层
- 增加网络深度
小结和补充

概述

用深度学习的方法进行端到端的时间序列预测需要一下几个步骤
1.对数据进行预处理，比如数据清洗，归一化等，然后把时间序列数据转化为监督问题数据。
2.进行基准方法的常识。基准方法可以选择基于常识的和基于简单机器学习的。
3.模型的搭建和与结果的对比
4.不断地调优模型

本文选用的例子为时间序列预测，数据集从这里下载，它由德国耶拿的马克思• 普朗克生物地球化学研究所的气象站记录。在这个数据集中，每10 分钟记录14 个不同的量（比如气温、气压、湿度、风向等），其中包含多年的记录。原始数据可追溯到2003 年，但本例仅使用2009—2016 年的数据。这个数据集非常适合用来学习处理数值型时间序列。我们将会用这个数据集来构建模型，输入最近的一些数据（几天的数据点），可以预测24 小时之后的气温。

数据集的预处理

首先用pandas去读取数据并可视化,分别画出全部样本和10天的温度状况

import os
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt

lookback = 1440
step = 6
delay = 144
batch_size = 128

data_dir = ''
fname = os.path.join(data_dir, 'jena_climate_2009_2016.csv')
df = pd.read_csv(fname)
print(df.head())
temp = df["T (degC)"].values
#要转化类型
float_data = df.values[:,1:].astype(np.float64)


#可视化样本
fig = plt.figure()
ax = fig.add_subplot(211)
ax.plot(range(len(temp)), temp)
ax2 = fig.add_subplot(212)
ax2.plot(range(1440), temp[:1440])
plt.show()

在这里插入图片描述
对数据进行标准化

mean = float_data[:200000].mean(axis=0)
float_data -= mean
std = float_data[:200000].std(axis=0)
float_data /= std

然后很重要的一点，将数据转成监督学习的模式，如果样本数比较大，需要写生成器来进行操作,并对训练集和测试集、验证集进行划分。
参数

lookback = 1440
step = 6
delay = 144
batch_size = 128

本次训练是用前10天的数据预测1天后的数据(1个点)，训练是采样频率为1小时，即6个点采一个，训练批量为128.即批量训练的数据为[128,144*10/6,14],标签为[128,1]

def generator(data, lookback, delay, min_index, max_index,
              shuffle=False, batch_size=

最低0.47元/天解锁文章

格拉迪沃

关注

6
点赞
踩
53

收藏

觉得还不错? 一键收藏
2
评论
keras进行时间序列预测

时间序列预测概述数据集的预处理基准方法调优增加dropout层增加网络深度概述用深度学习的方法进行端到端的时间序列预测需要一下几个步骤1.对数据进行预处理，比如数据清洗，归一化等，然后把时间序列数据转化为监督问题数据。2.进行基准方法的常识。基准方法可以选择基于常识的和基于简单机器学习的。3.模型的搭建和与结果的对比4.不断地调优模型本文选用的例子为时间序列预测，数据集从这里下载，它...
复制链接

扫一扫

专栏目录