用Prophet在Python中进行时间序列预测

拓端研究室

已于 2024-08-01 23:03:01 修改

阅读量1.6k

点赞数

分类专栏： R语言 python 文章标签： Prophet Python 时间序列预测

于 2019-10-17 16:00:12 首次发布

本文链接：https://blog.csdn.net/qq_19600291/article/details/102607395

版权

496 篇文章 85 订阅

订阅专栏

150 篇文章 3 订阅

订阅专栏

预测通常被认为是报告的发展。报告可以帮助我们回答，发生了什么事？预测有助于回答下一个逻辑问题，将会发生什么？

Prophet的目的是“使专家和非专家可以更轻松地进行符合需求的高质量预测。

您将学习如何使用Prophet（在Python中）解决一个常见问题：预测下一年公司的每日订单。

Prophet最适合每日定期数据以及至少一年的历史数据。我们将使用SQL处理每天要预测的数据：

select
  date,
  value
from modeanalytics.daily_orders
order by date

我们可以将SQL查询结果集通过管道传递R数据框对象中。首先，将您的SQL查询重命名为Daily Orders。然后，在R 中，我们可以使用以下语句将查询结果集传递到数据帧df中：

df = datasets["Daily Orders"]

为了快速了解您的数据框包含多少个观测值，可以运行以下语句：

df.shape

Prophet输入DataFrame中有两列：分别包含日期和数值。

df.dtypes

确认数据框中的列是正确的数据类型，就可以ds在数据框中创建一个新列，是该列的完全相同的副本：

df['ds'] = df['date']
df['y'] = df['value']

然后，您可以重新调整该date列的用途，以用作数据框的索引：

df.set_index('date')

现在您已经准备好要与Prophet一起使用的数据，在将数据输入到Prophet中之前，将其作图并检查数据。

通常在预测中，您会明确选择一种特定类型的幂变换，以将其应用于数据以消除噪声，然后再将数据输入到预测模型中（例如，对数变换或平方根变换等）。但是，有时可能难以确定哪种变换适合您的数据。

Box-Cox变换是一种数据变换，用于评估一组Lambda系数（λ）并选择可实现最佳正态性近似值的值。
对于我们的示例，我们将让该boxcox方法确定用于变换的最佳λ，并将该值返回给名为lam的变量：


# 将Box-Cox转换应用于值列并分配给新列y


df['y'], lam = boxcox(df['value'])

如果我们将新转换的数据与未转换的数据一起绘制，则可以看到Box-Cox转换能够消除随着时间变化而观察到增加的方差：

使用Prophet创建预测的第一步是将fbprophet库导入到我们的Python中：

import fbprophet

将Prophet库导入笔记本后，我们可以从 Prophet开始：

m = fbprophet.Prophet()

实例化Prophet对象后，就可以将模型拟合到历史数据中了。您可以通过fit在Prophet对象上调用方法并传入数据框来实现此目的：

使用Prophet通过Box-Cox转换的数据集拟合模型后，现在就可以开始对未来日期进行预测。

现在，我们可以使用predict方法对未来数据帧中的每一行进行预测。

此时，Prophet将创建一个分配给变量的新数据框，其中包含该列下未来日期的预测值yhat以及置信区间和预测部分。我们可以使用Prophet的内置plot将预测可视化：
在我们的示例中，我们的预测如下所示：

如果要可视化各个预测成分，则可以使用Prophet的内置plot_components方法：
plot_components在我们的示例数据上运行将返回以下一组成分可视化：

预测和成分可视化显示，Prophet能够准确地建模数据中的潜在趋势，同时还可以精确地建模每周和每年的季节性（例如，周末和节假日的订单量较低）。

由于Prophet用于Box-Cox转换后的数据，因此您需要将预测值转换回其原始单位。要将新的预测值转换回其原始单位，您将需要执行Box-Cox逆转换。

该inv_boxcox方法有两个必需的输入。要转换的数据数组和转换的λ值。我们将对预测数据帧中的特定列进行逆变换，并提供先前从存储在lam变量中的第一个Box-Cox变换中获得的λ值：


现在，您已将预测值转换回其原始单位，现在可以将预测值与历史值一起可视化：

关注

专栏目录