老外的时间序列预测示例，类似于自回归

最新推荐文章于 2022-08-10 14:45:08 发布

qq_903012463

最新推荐文章于 2022-08-10 14:45:08 发布

阅读量268

点赞数

分类专栏： tensorflow应用文章标签：深度学习

本文链接：https://blog.csdn.net/qq_43309133/article/details/108107278

版权

tensorflow应用专栏收录该内容

37 篇文章 2 订阅

订阅专栏

try:
  # %tensorflow_version only exists in Colab.
  %tensorflow_version 2.x
except Exception:
  pass

加了调整GPU分配方式的操作

import tensorflow as tf
gpus = tf.config.experimental.list_physical_devices('GPU')
for gpu in gpus:
    tf.config.experimental.set_memory_growth(gpu, True)
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
print(tf.__version__)

def plot_series(time, series, format="-", start=0, end=None):
    plt.plot(time[start:end], series[start:end], format)
    plt.xlabel("Time")
    plt.ylabel("Value")
    plt.grid(True)

def trend(time, slope=0):
    return slope * time

def seasonal_pattern(season_time):
    """Just an arbitrary pattern, you can change it if you wish"""
    return np.where(season_time < 0.4,
                    np.cos(season_time * 2 * np.pi),
                    1 / np.exp(3 * season_time))

def seasonality(time, period, amplitude=1, phase=0):
    """Repeats the same pattern at each period"""
    season_time = ((time + phase) % period) / period
    return amplitude * seasonal_pattern(season_time)

def noise(time, noise_level=1, seed=None):
    rnd = np.random.RandomState(seed)
    return rnd.randn(len(time)) * noise_level

time = np.arange(4 * 365 + 1, dtype="float32")
baseline = 10
series = trend(time, 0.1)  
baseline = 10
amplitude = 40
slope = 0.05
noise_level = 5

# Create the series
series = baseline + trend(time, slope) + seasonality(time, period=365, amplitude=amplitude)
# Update with noise
series += noise(time, noise_level, seed=42)

split_time = 1000
time_train = time[:split_time]
x_train = series[:split_time]
time_valid = time[split_time:]
x_valid = series[split_time:]

window_size = 20
batch_size = 32
shuffle_buffer_size = 1000

关键是接下来他怎么把numpy.array变成可训练的dataset

步骤	方法
Step1	array用tf.data.Dataset.from_tensor_slices变成可迭代的tensor,（和第一个教程不一样，他是先tf.constant转化为tensor又带入from…())
Step2	用.window方法将原数据扩展成应有的元素,drop_remainder用来忽略最后不整齐的
Step3	批处理flat_map，将长数据列分成一个个window用[]括起来。他的这个window是包括lable的 .可以shuffle
Step4	用map批处理（为什么不是flat_map？)，将window再分为X_window，和Y

series = tf.expand_dims(series, axis=-1)的作用：

在这里插入图片描述
ds = tf.data.Dataset.from_tensor_slices(series)的效果：ds = ds.window(window_size + 1, shift=1, drop_remainder=True)的效果：

在这里插入图片描述
ds = ds.flat_map(lambda w: w.batch(window_size + 1))的效果：
dataset = dataset.shuffle(shuffle_buffer).map(lambda window: (window[:-1], window[-1]))的效果：
dataset = dataset.batch(batch_size).prefetch(1)的效果：

def windowed_dataset(series, window_size, batch_size, shuffle_buffer):
    series = tf.expand_dims(series, axis=-1)
    ds = tf.data.Dataset.from_tensor_slices(series)
    ds = ds.window(window_size + 1, shift=1, drop_remainder=True)
    ds = ds.flat_map(lambda w: w.batch(window_size + 1))
    ds = ds.shuffle(shuffle_buffer)
    ds = ds.map(lambda w: (w[:-1], w[1:]))
    return ds.batch(batch_size).prefetch(1)
    
def model_forecast(model, series, window_size):
    ds = tf.data.Dataset.from_tensor_slices(series)
    ds = ds.window(window_size, shift=1, drop_remainder=True)
    ds = ds.flat_map(lambda w: w.batch(window_size))
    ds = ds.batch(32).prefetch(1)
    forecast = model.predict(ds)
    return forecast

创建模型

tf.keras.backend.clear_session()
tf.random.set_seed(51)
np.random.seed(51)

window_size = 30
train_set = windowed_dataset(x_train, window_size, batch_size=128, shuffle_buffer=shuffle_buffer_size)

model = tf.keras.models.Sequential([
  tf.keras.layers.Conv1D(filters=32, kernel_size=5,
                      strides=1, padding="causal",
                      activation="relu",
                      input_shape=[None, 1]),
  tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(32, return_sequences=True)),
  tf.keras.layers.Bidirectional(tf.keras.layers.LSTM(32, return_sequences=True)),
  tf.keras.layers.Dense(1),
  tf.keras.layers.Lambda(lambda x: x * 200)
])

训练时候的技巧：回调函数callbacks. callbacks在外面设置后，然后添加到fit里面
callback.LearningRateScheduler()管理学习率，另外补充下正则表达式如何表述函数： lamda 变量：f(变量)；返回f(变量) 。
callback还有ModelCheckpoint，返回检查点，就是当时的模型参数状态。
callback.Tensorboard，返回当时的模型性能，用来在web中查看。
callback.ReduceLROnPlateau(monitor=“loss”,factor = 0.5, patience = 40)，设置学习率衰减，当然还有别的方法，一会我要整理一个专门的学习率衰减。
callback.EarlyStopping(monitor = “loss”, patience= 80) 。
应用： callbacks_list = [callback1, callback2, …]，model.fit(train_db, epochs=100, callback=callback_list)

lr_schedule = tf.keras.callbacks.LearningRateScheduler(
    lambda epoch: 1e-8 * 10**(epoch / 20))
optimizer = tf.keras.optimizers.SGD(lr=1e-8, momentum=0.9)
model.compile(loss=tf.keras.losses.Huber(),
              optimizer=optimizer,
              metrics=["mae"])
history = model.fit(train_set, epochs=100, callbacks=[lr_schedule])

plt.semilogx(history.history["lr"], history.history["loss"])
plt.axis([1e-8, 1e-4, 0, 30])


tf.keras.backend.clear_session()
tf.random.set_seed(51)
np.random.seed(51)
#batch_size = 16
dataset = windowed_dataset(x_train, window_size, batch_size, shuffle_buffer_size)
model = tf.keras.models.Sequential([
  tf.keras.layers.Conv1D(filters=32, kernel_size=3,
                      strides=1, padding="causal",
                      activation="relu",
                      input_shape=[None, 1]),
  tf.keras.layers.LSTM(32, return_sequences=True),
  tf.keras.layers.LSTM(32, return_sequences=True),
  tf.keras.layers.Dense(1),
  tf.keras.layers.Lambda(lambda x: x * 200)
])

optimizer = tf.keras.optimizers.SGD(lr=1e-5, momentum=0.9)
model.compile(loss=tf.keras.losses.Huber(),
              optimizer=optimizer,
              metrics=["mae"])
history = model.fit(dataset,epochs=500)

rnn_forecast = model_forecast(model, series[..., np.newaxis], window_size)
rnn_forecast = rnn_forecast[split_time - window_size:-1, -1, 0]

plt.figure(figsize=(10, 6))
plot_series(time_valid, x_valid)
plot_series(time_valid, rnn_forecast)

tf.keras.metrics.mean_absolute_error(x_valid, rnn_forecast).numpy()

import matplotlib.image  as mpimg
import matplotlib.pyplot as plt

#-----------------------------------------------------------
# Retrieve a list of list results on training and test data
# sets for each training epoch
#-----------------------------------------------------------
mae=history.history['mae']
loss=history.history['loss']

epochs=range(len(loss)) # Get number of epochs

#------------------------------------------------
# Plot MAE and Loss
#------------------------------------------------
plt.plot(epochs, mae, 'r')
plt.plot(epochs, loss, 'b')
plt.title('MAE and Loss')
plt.xlabel("Epochs")
plt.ylabel("Accuracy")
plt.legend(["MAE", "Loss"])

plt.figure()

epochs_zoom = epochs[200:]
mae_zoom = mae[200:]
loss_zoom = loss[200:]

#------------------------------------------------
# Plot Zoomed MAE and Loss
#------------------------------------------------
plt.plot(epochs_zoom, mae_zoom, 'r')
plt.plot(epochs_zoom, loss_zoom, 'b')
plt.title('MAE and Loss')
plt.xlabel("Epochs")
plt.ylabel("Accuracy")
plt.legend(["MAE", "Loss"])

plt.figure()

发现的问题：老外没有进行数据标准化处理。是不是趋势性的时间序列都不应该进行标准化呢？

qq_903012463

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
老外的时间序列预测示例，类似于自回归

第一步，array用tf.data.Dataset.from_tensor_slices变成可迭代的tensor,（和第一个教程不一样，他是先tf.constant转化为tensor又带入from......()) # 第二步，用.window方法将原数据扩展成应有的元素,drop_remainder用来忽略最后不整齐的 # 第三步，批处理flat_map，将长数据列分成一个个window用[]括起来。他的这个window是包括lable的 # 第四步，打乱 # 第五步，用map批处
复制链接

扫一扫