使用LSTM、GRU、RNN进行预测(小白教程)
RNN存在两个问题:梯度爆炸 + 梯度消失,为解决RNN存在的问题,LSTM产生,LSTM神经元包含三个门:遗忘门、输入门、输出门,其中,遗忘门控制着应该保留多少旧信息,输入门控制着多少新的信息可以进入单元,输出门则控制着要输出多少信息。GRU是LSTM的简化版,就是一个没有输出门的LSTM,GRU神经元包含两个门:重置门和更新门,更新门便是遗忘门和输入门的合并。
好了,相关理论就不多说了,直接来做吧~
此篇博客主要使用LSTM、GRU、RNN对大气能见度进行预测
完整代码大家可以到我的git上下载,链接如下:
https://github.com/ainiyk/Air-Quality-Predicition#air-quality-predicition
预测步骤如下:
1、准备数据集
2、归一化数据
3、超参赋值
4、定义代价函数、优化函数
5、训练模型
6、预测
首先读入数据,进行数据预处理。我针对自己的数据进行相关简单处理,比如下面代码中的set_index、drop一些没有用的列,当然在这个阶段还可以做一些缺失值处理的工作等等。
#load data and set index
df = pd.read_csv('beijing.csv',infer_datetime_format=True)
df.set_index(inplace=True, keys=['date'])
df = df.drop(['district_id'],axis=1)
#show the dataset
df.head(5)
处理后的前五条记录展示如下:
接下来,选择我需要的记录,并进行训练集、测试集的划分
#preparation for the dataset
def get_date_str(x, formate='%Y-%m-%d %H:%M:%S'):
return x.strftime(formate)
start = datetime(2018, 3, 3, 0, 0, 0)
start = get_date_str(start)
end = datetime(2018, 8