时间序列之：多步预测、长序列预测——Informer / ARIMA

ManRock

已于 2023-06-05 17:18:30 修改

阅读量5.4k

点赞数 2

分类专栏：机器学习文章标签：机器学习

于 2023-06-05 16:35:49 首次发布

本文链接：https://blog.csdn.net/yanghe4405/article/details/131051018

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

多步预测是指根据已知的时间序列数据预测未来多个时间步长的值。在ARIMA模型中，可以使用预测函数进行多步预测。

Informer是一种用于时间序列预测的神经网络模型，旨在解决长序列预测中的挑战，如长期依赖性和变长序列。它结合了自注意力机制、卷积神经网络和传统的循环神经网络，以提高时间序列预测的准确性和效率。

Informer模型的核心思想是将输入序列分成不同的时间段，然后通过编码器-解码器结构进行建模。编码器部分使用自注意力机制和卷积层来捕捉序列内部的长期依赖关系和局部模式。解码器部分使用传统的循环神经网络来生成预测结果。此外，Informer还引入了一种长度编码机制，用于对变长序列进行建模。

用Informer进行时间序列预测（基于PyTorch）：

import torch
import torch.nn as nn
from informer.models import Informer

# 创建Informer模型
model = Informer(
    enc_in=1,  # 输入序列的特征数
    dec_in=1,  # 输出序列的特征数
    c_out=1,   # 输出序列的维度
    seq_len=10,  # 输入序列的长度
    label_len=5,  # 输出序列的长度
    pred_len=1,  # 预测的时间步长
    factor=5,  # 编码器和解码器的缩放因子
    d_model=256,  # 模型的隐藏维度
    n_heads=8,  # 注意力头的数量
    e_layers=2,  # 编码器的层数
    d_layers=1,  # 解码器的层数
    d_ff=512,  # 前馈神经网络的隐藏层维度
    dropout=0.1,  # Dropout概率
    activation='gelu',  # 激活函数类型
    output_attention=False,  # 是否输出注意力权重
    distil=True,  # 是否使用蒸馏机制
    device=torch.device('cuda' if torch.cuda.is_available() else 'cpu')  # 使用GPU或CPU进行训练
)

# 定义损失函数和优化器
criterion = nn.MSELoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

# 准备输入数据
x_train = torch.randn(100, 10, 1)  # 输入训练数据，大小为(样本数, 输入序列长度, 特征数)
y_train = torch.randn(100, 5, 1)   # 输出训练数据，大小为(样本数, 输出序列长度, 特征数)

# 将数据传入模型进行训练
model.train()
optimizer.zero_grad()
outputs = model(x_train, y_train[:, :-1, :])  # 预测输出，大小为(样本数, 预测序列长度, 特征数)
loss = criterion(outputs, y_train[:, 1:, :])  # 计算损失
loss.backward()
optimizer.step()

# 使用训练好的模型进行预测
model.eval()
x_test = torch.randn(10, 10, 1)  # 输入测试数据，大小为(样本数, 输入序列长度, 特征数)
preds = model.predict(x_test)  # 预测输出，大小为(样本数, 预测序列长度, 特征数)

上述代码中，通过调用Informer类创建了Informer模型，并定义了损失函数和优化器。然后，使用训练数据进行模型训练，通过调用model.train()、optimizer.zero_grad()、model()和loss.backward()实现反向传播和参数更新。最后，使用训练好的模型对测试数据进行预测，通过调用model.eval()和model.predict()获取预测结果。

请注意，上述代码仅为示例，实际应用中需要根据数据和任务的特点进行适当的调整和修改。

用ARIMA模型进行多步预测：

import numpy as np
import statsmodels.api as sm

# 创建时间序列数据
# 注意：ARIMA模型要求数据是平稳的，这里仅作示例，并没有对数据进行平稳性处理
data = np.array([10, 20, 30, 40, 50, 60, 70, 80, 90, 100])

# 创建ARIMA模型并拟合数据
model = sm.tsa.arima.ARIMA(data, order=(1, 0, 0))  # ARIMA(1, 0, 0)模型
model_fit = model.fit()

# 预测未来的观测值（多步预测）
forecast = model_fit.forecast(steps=3)  # 预测3个时间步长的观测值
print(forecast)