我试图了解如何正确地将数据输入到我的keras模型中,使用LSTM神经网络将多变量时间序列数据分为三类。在
我已经查看了不同的资源——主要是Jason Brownlee post1,post2,post3)、其他SO questions和不同的{a5}的三篇优秀的博客文章,但其中给出的信息都不完全适合我的问题情况,我无法确定我的数据预处理/输入模型是否正确,所以我想如果我在这里指定我的确切条件,我可能会得到一些帮助。在
我要做的是对多元时间序列数据进行分类,原始形式的数据结构如下:我有200个样品
一个示例是一个csv文件。
一个样本可以有1到50个特征(即csv文件有1到50列)。
每一个特性都有它的价值在固定的时间内被“跟踪”
步骤,假设是100(即每个csv文件正好有100行)。
每个csv文件有三个类(“good”、“too small”、“too big”)
所以我现在的状态是:
我有一个numpy数组“samples”,其结构如下:# array holding all samples
[
# sample 1
[
# feature 1 of sample 1
[ 0.1, 0.2, 0.3, 0.2, 0.3, 0.1, 0.2, 0.4, 0.5, 0.1, ... ], # "time series" of feature 1
# feature 2 of sample 1
[ 0.5, 0.6, 0.7, 0.6, 0.4, 0.3, 0.2, 0.1, -0.1, -0.2, ... ], # "time series" of feature 2
... # up