Python Statsmodels：时间序列分析与预测实战工具分享

最新推荐文章于 2025-03-20 16:29:40 发布

老余捞鱼

最新推荐文章于 2025-03-20 16:29:40 发布

阅读量2.3k

点赞数 46

分类专栏： AI顾投高级策略 AI探讨与学习文章标签： python 开发语言

本文链接：https://blog.csdn.net/weixin_70955880/article/details/145570373

版权

AI顾投高级策略同时被 2 个专栏收录

211 篇文章

订阅专栏

AI探讨与学习

67 篇文章

订阅专栏

作者：老余捞鱼

原创不易，转载请标明出处及原作者。

写在前面的话：Python中的Statsmodels可以极大地简化时间序列分析的过程，这个智能库不仅能处理ARIMA、SARIMA、LSTM等复杂模型，还能轻松进行数据可视化。在这篇文章中，我将分享如何快速上手这一强大的工具，并通过实际案例展示其在数据分析中的应用。无论是初学者还是有经验的量化老手，都能从本文中获得宝贵的知识，提升自己的数据分析能力。

一、什么是 Statsmodels ？

Statsmodels 是一个用于统计建模和经济学的 Python 智能库。它提供了丰富的功能，允许用户进行数据分析、估计统计模型、进行假设检验以及生成各种统计图表。

Statsmodels 特别适合于处理线性回归、时间序列分析、广义线性模型等多种统计方法。同时它支持单变量和多变量的时间序列建模。它内置了很多统计检验方法，可以用来评估模型的假设和性能。

该库的设计旨在为用户提供一个简单易用的接口，同时保持强大的功能和灵活性。而如果你想用 ARIMA 或 SARIMA 模型，它绝对是首选。它还能与 pandas 和 numpy 无缝配合使用。

线性回归：Statsmodels 提供了多种线性回归模型的实现，包括普通最小二乘法（OLS）和加权最小二乘法（WLS）。
广义线性模型：支持多种分布的广义线性模型（GLM），如二项分布、泊松分布等。
时间序列分析：提供了对时间序列数据的分析工具，包括自回归移动平均模型（ARMA）、自回归积分滑动平均模型（ARIMA）等。
假设检验：Statsmodels 提供了多种统计检验方法，如 t 检验、卡方检验等，帮助用户验证模型的有效性。
模型诊断：提供了多种工具用于模型的诊断和评估，包括残差分析和多重共线性检测。
可视化：支持生成各种统计图表，帮助用户更好地理解数据和模型。

二、基于 Statsmodels 代码示例

下面这段代码将展示如何使用Python进行时间序列分析、建模和预测。代码涵盖了从数据生成、可视化、分解、平稳性检验、自相关分析、ARIMA模型拟合到LSTM神经网络模型的构建和评估。

2.1 源代码下载

完整源代码请在我的Google Colab中直接使用和下载：
https://colab.research.google.com/drive/1AVOotPzd1zKul4GsDHeJuBWheYPXQpGT?usp=sharing

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from statsmodels.tsa.api import SimpleExpSmoothing, Holt, ExponentialSmoothing
from statsmodels.tsa.stattools import adfuller, acf, pacf
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.seasonal import seasonal_decompose

"""
Generate or Load Time Series Data
Simulate a time series with trend and seasonality
"""

"""
Time Series Decomposition
Use seasonal_decompose to split the series into trend, seasonal, and residual components.

"""

"""
Check for Stationarity
Use the Augmented Dickey-Fuller (ADF) test to assess stationarity.
"""

"""
Autocorrelation and Partial Autocorrelation
Visualize the ACF and PACF to determine lag dependencies.
"""

"""
Fit an ARIMA Model
Fit an ARIMA model to the data for forecasting.
"""

"""
Tensorflow (Keras) using an LSTM model

"""

# Prepare Data for LSTM
scaler = MinMaxScaler()
df["value"] = scaler.fit_transform(df["value"].values.reshape(-1, 1))

# Plot the Results
plt.figure(figsize=(12, 8))
plt.plot(df.index, scaler.inverse_transform(df["value"].values.reshape(-1, 1)), label="Actual Data", color="Blue")
train_index = df.index[lag:train_size + lag]
plt.plot(train_index, train_predictions_inverse, label="Training Predictions", color="Orange")
test_index = df.index[train_size + lag:]
plt.plot(test_index, y_test_inverse, label="Hold-Out (True Values)", color="Green")
plt.plot(test_index, y_pred_lstm_inverse, label="Testing Predictions", color="Red")
plt.title(f'LSTM Forecast. MAPE: {mape:.3%}')
plt.xlabel("Date")
plt.ylabel("Value")
plt.legend()
plt.grid()
plt.savefig("LSTM_forecast_with_holdout.png")
plt.show()