MXNET之GluonTS学习手册：第二章《DeepAR的输入/输出》

最新推荐文章于 2024-05-21 12:09:18 发布

小树ZW

最新推荐文章于 2024-05-21 12:09:18 发布

阅读量5.7k

点赞数 8

分类专栏： GluonTS 文章标签： mxnet gluonts DeepAR 数据预测

本文链接：https://blog.csdn.net/qq_34461600/article/details/103067584

版权

阅读本手册需要一定mxnet、gluon操作基础。
本文使用cpu训练代码。
个人博客地址：https://zmkwjx.github.io
本文github地址：https://github.com/zmkwjx/GluonTS-Learning-in-Action
GluonTS官网地址：https://gluon-ts.mxnet.io

1、DeepAR介绍

在GluonTS中，DeepAR实现了一种基于RNN的模型，使用自回归递归网络进行概率预测，是一种在大量相关时间序列上训练自回归递归网络模型的基础上，用于产生准确概率预测的方法。与最新技术相比，其准确性提高了15％左右。
概率预测（即根据时间序列的过去来估计时间序列的未来的概率分布）是优化业务流程的关键因素。

注意：此模型的代码与SageMaker的DeepAR预测算法背后的实现无关

2、DeepAR的输入/输出

DeepAR支持两个数据通道。所需的train通道描述了训练数据集。可选test通道描述了算法用于训练后评估模型准确性的数据集。您可以采用JSON行格式提供训练和测试数据集。
指定训练和测试数据的路径时，可以指定一个文件或包含多个文件的目录，这些文件可以存储在子目录中。如果指定目录，则DeepAR会将目录中的所有文件用作相应通道的输入。默认情况下，DeepAR模型使用 .json文件 输入数据。

载入数据集的方法

# 后面将对该方法进行介绍
common.FileDataset("此处填入训练数据文件夹的绝对路径", freq="H")

2.1 输入数据字段格式

start — 格式为 yyy-MM-DD HH:MM:SS 的字符串。开始时间戳不能包含时区信息。
target — 表示时间序列的浮点值或整数数组。您可以将丢失的值编码为null，或者在JSON中编码为"NAN"字符串：

{
   "start": "2009-11-01 00:00:00", "target": [5, "NAN", 7, 12]}

feat_dynamic_real (可选) — 代表自定义要素时间序列（动态要素）向量的浮点值或整数数组。如果设置此字段，则所有记录必须具有相同数量的内部数组（相同数量的特征时间序列）。此外，每个内部数组必须具有与关联target值相同的长度。例如，如果目标时间序列代表不同产品的需求，则feat_dynamic_real可能是布尔时间序列，它指示是否对特定产品应用了促销：

{
   "start": ..., "target": [5, "NAN", 7, 12], "dynamic_feat": [[1, 0, 0, 1]]}

feat_static_cat (可选) — 可以用于对记录所属的组进行编码的分类特征数组。分类要素必须编码为基于0的正整数序列。例如，分类域{R，G，B}可以编码为{0，1，2}。来自每个分类域的所有值都必须在训练数据集中表示。

如果您使用JSON文件，则该文件必须为JSON Lines格式。例如：

{
   "start": "2009-11-01 00:00:00", "target":

最低0.47元/天解锁文章

小树ZW

关注

8
点赞
踩
35

收藏

觉得还不错? 一键收藏
打赏
1
评论
MXNET之GluonTS学习手册：第二章《DeepAR的输入/输出》

阅读本手册需要一定mxnet、gluon操作基础。本文使用cpu训练代码。个人博客地址：https://zmkwjx.github.io本文github地址：https://github.com/zmkwjx/GluonTS-Learning-in-ActionGluonTS官网地址：https://gluon-ts.mxnet.io1、DeepAR介绍在GluonTS中，Deep...
复制链接

扫一扫