Tensoflow2下的keras LSTM和Conv1D的参数input_shape需要指定吗

最新推荐文章于 2023-08-17 23:49:48 发布

BRYTLEVSON

最新推荐文章于 2023-08-17 23:49:48 发布

阅读量1.8k

点赞数 1

本文链接：https://blog.csdn.net/brytlevson/article/details/114076656

版权

Tensoflow2下的keras API LSTM和Conv1D没有使用的参数input_shape吗？

LSTM代码1

model = keras.Sequential()
# model.add(keras.layers.LSTM(32, input_shape=[X_train[1:]], return_sequences=True))
model.add(keras.layers.LSTM(32, return_sequences=True))
model.add(keras.layers.LSTM(32, return_sequences=True))
model.add(keras.layers.LSTM(32, return_sequences=True))
model.add(keras.layers.LSTM(32, return_sequences=False))
model.add(keras.layers.Dense(1))

LSTM代码2

model = tf.keras.Sequential()
model.add(tf.keras.layers.LSTM(50, activation='relu'))
model.add(tf.keras.layers.Dense(20, activation='relu'))
model.add(tf.keras.layers.Dense(10, activation='relu'))
model.add(tf.keras.layers.Dense(1, activation='linear'))

>> ts_train_X.shape
(16469, 3, 21)

许多有关stackoverflow的文章和问题，以便为LSTM提供合适的数据框。发现几乎每个页面都指定了该input_shape参数，并将其传递给LSTM（…）

为什么我的代码有效？如果不指定input_shape参数，那么作为第一层的LSTM层如何知道输入的形状？

conv1D代码

model = keras.Sequential()
# model.add(keras.layers.Conv1D(32, 7, input_shape=X_train[1:]))  
model.add(keras.layers.Conv1D(32, 7, activation='relu', padding='same')) 
model.add(keras.layers.MaxPooling1D())
model.add(keras.layers.Conv1D(32, 7, activation='relu', padding='same'))
model.add(keras.layers.GlobalMaxPool1D())
model.add(keras.layers.Dense(10, activation='relu'))
model.add(keras.layers.Dense(99, activation='softmax'))

conv1D不指定input_shape的话，在fit之前会报错

ValueError: This model has not yet been built. Build the model first by calling `build()` or calling `fit()` with some data, or specify an `input_shape` argument in the first layer(s) for automatic build.

然后根据错误得出，在fit之后网络会自己推断出input_shape,在fit之后打印网络结果就不需要指定input_shape，fit之前需要指定。

embedding与LSTM代码

model = keras.Sequential()
# Embedding把文本映射成密集向量
model.add(keras.layers.Embedding(max_word, 50, input_length=maxlen))
model.add(keras.layers.LSTM(64, return_sequences=False))
model.add(keras.layers.Dense(10, activation='relu'))
model.add(keras.layers.Dense(1, activation='sigmoid'))
model.summary()

这里不需要指定是因为前面Embedding指定了，第二层就不用指定了。

总结：
上面不指定input_shape代码有效，因为input_shape将其作为关键字参数（**kwargs）传递，然后这些关键字参数由LSTM构造函数传递给Layer构造函数，然后构造函数继续存储信息以供以后使用。
在这里插入图片描述

BRYTLEVSON

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
Tensoflow2下的keras LSTM和Conv1D的参数input_shape需要指定吗

Tensoflow2下的keras API LSTM和Conv1D未使用的参数input_shape吗？许多有关stackoverflow的文章和问题，以便为LSTM提供合适的数据框。发现几乎每个页面都指定了该input_shape参数，并将其传递给LSTM（..）为什么我的代码有效？如果不指定input_shape参数，那么作为第一层的LSTM层如何知道输入的形状？
复制链接

扫一扫