讨论贴,lstm的数据集的构建。(更新)

lstm的数据集构建

目前本人的认知是shape是(batch_size,timestep,ouput_size)是正确的,不知道有没有同样疑惑的伙伴,欢迎讨论交流。

以单步预测为例

  • input_size :输入层尺寸,即用作特征的列的个数
  • output_size :输出层尺寸,即用作标签的列的个数
  • time_step :LSTM中的time_step,即用前多少天的数据来预测后一天
  • batch_size :单次传递给模型用以训练的样本个数

lstm的输入X的shape是(batch_size,timestep,input_size)

那输出y的shape是(batch_size,timestep,ouput_size)

还是y的shape是(batch_size,1,ouput_size)

网上的案例基本存在这两种数据集,多数是(batch_size,1,ouput_size)但是以下图对应结构,

y的shape是(batch_size,timestep,ouput_size)似乎更合理,求教。

转载pytorch中LSTM参数详解(一张图帮你更好的理解每一个参数)_lstm pytorch 参数-CSDN博客

例如径流预测,单变量的时间序列,input_size=1;

采用前30天数据预测第31天数据,timestep=30;

ouput_size = 1

batch_size=12

构建数据集train_x,shape(12,30,1)

train_y的shape是(12,1,1),还是(12,30,1)

  • 9
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
构建一个 LSTM 模型所需的数据集,需要按照以下步骤进行: 1. 确定数据集类型:LSTM 模型可以用于序列数据的预测,因此需要确定数据集是时序数据,或者是具有时间序列属性的数据。 2. 数据收集:根据数据集类型,收集相应的数据样本。对于时序数据,可以从历史记录、传感器数据或者天气数据等来源中收集数据。对于具有时间序列属性的数据,可以从交易记录、股票价格等来源中收集数据。 3. 数据预处理:将数据集中的数据进行预处理,包括数据清洗、数据归一化、特征选择等操作。 4. 数据划分:将数据集划分为训练集、验证集和测试集。通常情况下,训练集用于训练模型,验证集用于选择超参数和调整模型,测试集用于评估模型的性能。 5. 序列化:将数据集转化为 LSTM 模型可以处理的序列数据。可以使用滑动窗口方法将数据集中的数据按照一定的窗口大小进行切片,将每个窗口作为一个序列数据样本。 6. 标注数据:针对监督学习任务,需要为每个序列数据样本标注相应的标签或目标值。 7. 构建模型:基于 LSTM 模型的架构和目标函数,构建训练模型。 8. 训练模型:使用训练集对模型进行训练,并根据验证集的性能调整模型超参数和结构。 9. 模型评估:使用测试集对训练好的模型进行评估,得出相应的性能指标。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值