- LSTM模型 输入参数理解
(Long Short-Term Memory)
lstm是RNN模型的一种变种模式,增加了输入门,遗忘门,输出门。
LSTM也是在时间序列预测中的常用模型。
小白我也是从这个模型入门来开始机器学习的坑。
LSTM的基本概念与各个门的解释已经有博文写的非常详细:推荐博文:【译】理解LSTM(通俗易懂版)
这篇文章写的非常详细,生动,概念解释的非常清楚。我也是从这个博文里开始理解的。
- 模型参数
模型的调参是模型训练中非常重要的一部分,调整参数前的重要一步就是要理解参数是什么意思,才能帮助更好的调整参数。
但是发现在一些实战模型将代码直接放在那里,但是基本参数只是把定义写在哪里,没有生动的解释,我一开始看的时候也是一脸懵逼。
在我寻找着写参数的额定义的时候,往往看不到让小白一眼就能明白的解释。
希望从一个小白的角度来讲解我眼中的这些参数是什么意思,如果有不对,还请指出交流。 - LSTM 的参数输入格式
- 一般表示为[batch_size, time_step, input_size]
- 中文解释为[每一次feed数据的行数,时间步长,输入变量个数]
3.1 分开讲解,input_size
如果你使用7个自变量来预测1个因变量,那么input_size=7,output_size=1
如果你使用8个自变量来预测3个因变量,那么input_size=8,output_size=3
这个还是比较好理解的,你的输入数据,想要通过什么变量预测什么变量应