本文主要介绍循环神经网络的高级用法。
本节将介绍三种用于改善循环神经网络的性能和泛化能力的高级技术。
* *Recurrent dropout 递归丢失*,一种特定的内置方法,可以使用丢失来对抗复发层中的过度拟合。
* *Stacking recurrent layers 堆叠循环层*,以增加网络的代表性能力(以更高的计算负荷为代价)。
* *Bidirectional recurrent layers 双向循环层*,以不同方式向循环网络提供相同的信息,提高准确性并减少遗忘问题。
温度预测问题
将展示关于天气预报问题的所有三个概念,我们可以访问建筑物屋顶上安装的传感器的时间序列数据点,例如温度,气压和湿度,用它来预测收集最后一个数据点后24小时的温度。这是一个相当具有挑战性的问题,它体现了使用时间序列时遇到的许多常见困难。
们将播放德国耶拿Max-Planck生物地球化学研究所气象站记录的天气时间序列数据集:https://s3.amazonaws.com/keras-datasets/jena_climate_2009_2016.csv.zip。
在该数据集中,在几年内每十分钟记录十四种不同的量(例如空气温度,大气压力,湿度,风向等)。原始数据可以追溯到2003年,但本次测试仅限于2009 - 2016年的数据。该