PyTorchTS 使用教程
项目介绍
PyTorchTS 是一个基于 PyTorch 的概率时间序列预测框架,它利用 GluonTS 作为后端 API,提供了当前最先进的 PyTorch 时间序列模型。该项目旨在为时间序列分析提供一个强大的工具集,支持从数据加载、预处理到模型训练和预测的全流程。
项目快速启动
安装
首先,确保你已经安装了 Python 和 pip。然后,通过以下命令安装 PyTorchTS:
pip3 install pytorchts
快速示例
以下是一个简单的示例,展示如何使用 PyTorchTS 训练一个模型并进行预测。我们将使用 Twitter 上提到 AMZN 股票的推文数量作为数据集。
import matplotlib.pyplot as plt
import pandas as pd
import torch
from gluonts.dataset.common import ListDataset
from gluonts.dataset.util import to_pandas
from pts.model.deepar import DeepAREstimator
from pts import Trainer
# 加载数据
url = "https://raw.githubusercontent.com/numenta/NAB/master/data/realTweets/Twitter_volume_AMZN.csv"
df = pd.read_csv(url, header=0, index_col=0, parse_dates=True)
# 准备数据集
training_data = ListDataset(
[{"start": df.index[0], "target": df.values}],
freq="5min"
)
# 定义模型
estimator = DeepAREstimator(
freq="5min",
prediction_length=12,
trainer=Trainer(epochs=10)
)
# 训练模型
predictor = estimator.train(training_data=training_data)
# 进行预测
for test_entry in training_data:
future_series = to_pandas(test_entry)
forecast = predictor.predict(test_entry)
future_series[-12:].plot(linewidth=2)
forecast.plot(color='g', prediction_intervals=[50.0, 90.0])
plt.grid(which='both')
plt.legend(["observations", "median prediction", "90% prediction interval", "50% prediction interval"])
plt.show()
应用案例和最佳实践
应用案例
PyTorchTS 可以应用于多种时间序列预测场景,包括但不限于:
- 股票价格预测
- 销售量预测
- 网络流量预测
- 能源消耗预测
最佳实践
- 数据预处理:确保数据集经过适当的清洗和标准化处理。
- 模型选择:根据具体任务选择合适的模型,如 DeepAR、LSTNet 或 N-Beats。
- 超参数调优:使用网格搜索或随机搜索进行超参数调优,以获得最佳模型性能。
- 评估指标:使用适当的评估指标(如 MAE、MSE 或 MAPE)来评估模型性能。
典型生态项目
PyTorchTS 作为 PyTorch 生态系统的一部分,与其他项目和工具紧密集成,包括:
- PyTorch Lightning:用于简化深度学习模型的训练和验证。
- GluonTS:提供了一系列时间序列数据处理和模型评估工具。
- TorchServe:用于部署和管理 PyTorch 模型的服务框架。
这些工具和框架共同构成了一个强大的生态系统,支持从模型开发到部署的全流程。