MXNET之GluonTS学习手册:第二章《DeepAR的输入/输出》

阅读本手册需要一定mxnet、gluon操作基础。
本文使用cpu训练代码。
个人博客地址:https://zmkwjx.github.io
本文github地址:https://github.com/zmkwjx/GluonTS-Learning-in-Action
GluonTS官网地址:https://gluon-ts.mxnet.io

1、DeepAR介绍

在GluonTS中,DeepAR实现了一种基于RNN的模型,使用自回归递归网络进行概率预测,是一种在大量相关时间序列上训练自回归递归网络模型的基础上,用于产生准确概率预测的方法。与最新技术相比,其准确性提高了15%左右。
概率预测(即根据时间序列的过去来估计时间序列的未来的概率分布)是优化业务流程的关键因素。

2、DeepAR的输入/输出

DeepAR支持两个数据通道。所需的train通道描述了训练数据集。可选test通道描述了算法用于训练后评估模型准确性的数据集。您可以采用JSON行格式提供训练和测试数据集。
指定训练和测试数据的路径时,可以指定一个文件或包含多个文件的目录,这些文件可以存储在子目录中。如果指定目录,则DeepAR会将目录中的所有文件用作相应通道的输入。默认情况下,DeepAR模型使用 .json文件 输入数据。

  • 载入数据集的方法
# 后面将对该方法进行介绍
common.FileDataset("此处填入训练数据文件夹的绝对路径", freq="H")

2.1 输入数据字段格式

  • start — 格式为 yyy-MM-DD HH:MM:SS 的字符串。开始时间戳不能包含时区信息。
  • target — 表示时间序列的浮点值或整数数组。您可以将丢失的值编码为null,或者在JSON中编码为"NAN"字符串:
{
   "start": "2009-11-01 00:00:00", "target": [5, "NAN", 7, 12]}
  • feat_dynamic_real (可选) — 代表自定义要素时间序列(动态要素)向量的浮点值或整数数组。如果设置此字段,则所有记录必须具有相同数量的内部数组(相同数量的特征时间序列)。此外,每个内部数组必须具有与关联target值相同的长度 。例如,如果目标时间序列代表不同产品的需求,则feat_dynamic_real可能是布尔时间序列,它指示是否对特定产品应用了促销:
{
   "start": ..., "target": [5, "NAN", 7, 12], "dynamic_feat": [[1, 0, 0, 1]]}
  • feat_static_cat (可选) — 可以用于对记录所属的组进行编码的分类特征数组。分类要素必须编码为基于0的正整数序列。例如,分类域{R,G,B}可以编码为{0,1,2}。来自每个分类域的所有值都必须在训练数据集中表示。

如果您使用JSON文件,则该文件必须为JSON Lines格式。例如:

{
   "start": "2009-11-01 00:00:00", "target": 
  • 8
    点赞
  • 35
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小树ZW

你的鼓励是我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值