Keras之ConvLSTM参数详解——可以套模型了！

最新推荐文章于 2024-05-25 16:07:53 发布

当交通遇上机器学习

最新推荐文章于 2024-05-25 16:07:53 发布

阅读量7.8k

点赞数 3

本文链接：https://blog.csdn.net/zuiyishihefang/article/details/106624862

版权

keras中的ConvLSTM layer参数详解。

1、最重要的输入尺寸和输出尺寸

以data_format='channels_last'为例：

输入尺寸：输入 5D 张量，尺寸为： (samples,time, rows, cols, channels)。即要提前将训练集和测试集reshape成如上形式的tensor张量，例如下图：

输出尺寸：如果 return_sequences，返回 5D 张量，尺寸为：(samples, timesteps, output_row, output_col, filters)。否则，返回 4D 张量，尺寸为：(samples, output_row, output_col, filters)。（o_row 和 o_col 取决于 filter 和 padding 的尺寸）

注意：假如上一层是ConvLSTM2D layer，那么其输出为以上形式的4D张量或5D张量，当后面再接另外一个layer时，就要考虑该layer是否能接受4D张量或5D张量（即要考虑ConvLSTM2D的输出能否作为该layer的输入）

2、参数

ConvLSTM2D是一个LSTM网络，但它的输入变换和循环变换是通过卷积实现的如下图。其很多参数的理解上也可参考LSTM。

共25个参数，以下图为例对几个常用的参数进行解释，其他的请查阅Keras官网。

keras.layers.ConvLSTM2D(filters, kernel_size, strides=(1, 1), padding='valid', data_format=None, activation='tanh', recurrent_activation='hard_sigmoid', use_bias=True, return_sequences=False, stateful=False, dropout=0.0, recurrent_dropout=0.0)

Ø filters: 卷积核的数目（也就是上图中的两个filter W0和W1，也可以理解为输出的维度即两个绿色的框，filter0对应上面的绿色框，filter1对应下面的绿色的框）

Ø kernel_size：卷积核大小，上图中filterW0的宽和高（单个整数或由两个整数构成的list/tuple，卷积核的宽度和长度。如为单个整数1，则表示kernel_size=（1×1）。）

Ø strides=(1, 1)：为卷积的步长，即卷积核向右和向下一次移动几格，对应图中最左列蓝色3×3网格向右和向下移动的步长。（单个整数或由两个整数构成的list/tuple，为卷积的步长。如为单个整数，则表示在各个空间维度的相同步长。）

Ø padding：补0策略，为“valid”或 “same” 。要对所有的像素点进行处理就用same，same也是通用的，很少有用valid的。（ “valid”代表只进行有效的卷积，即对边界数据不处理。“same”代表保留边界处的卷积结果，通常会导致输出shape与输入shape相同。）

Ø data_format: 即红绿蓝三个通道(channel)是在前面还是在后面， channels_last (默认) （width, height, channel）或 channels_first (channel, width, height) 之一, 输入中维度的顺序。

Ø activation：激活函数，即下图中的RELU层，为预定义的激活函数名，如果不指定该参数，将不会使用任何激活函数（即使用线性激活函数：a(x)=x）

Ø recurrent_activation: 用于循环时间步的激活函数

（recurrent_activation 是针对于 input/forget/output 三个gate的激活函数. activation 是针对于 cell state 和 hidden state的激活函数. 下面所有参数带recurrent和不带recurrent的区别和此处相同）

Ø use_bias: 布尔值，是否使用偏置项

Ø return_sequences: 布尔值。是返回输出序列中的最后一个输出，还是全部序列。为true的话下图中1到5全部输出，为false的话下图中只输出红框中的5。

Ø stateful: 布尔值 (默认 False)。如果为 True，则批次中索引 i 处的每个样品的最后状态将用作下一批次中索引 i 样品的初始状态。对stateful的理解请看下图。Stateful为true时，训练和测试时的batch size必须得相同，且样本数目必须得能被batch size整除。

Ø dropout: 在 0 和 1 之间的浮点数。单元的丢弃比例，用于输入的线性转换，防止过拟合。

Ø recurrent_dropout: 在 0 和 1 之间的浮点数。单元的丢弃比例，用于循环层状态的线性转换。

Attention

如果你和我一样是轨道交通、交通运输、城市规划相关领域的，也愿意分享自己的科研生活，请加微信：Dr_JinleiZhang，备注“进群”，我会拉你进交通大数据分享群！希望我们共同进步！

Transportation-ML

与你分享科研成长的乐趣

长按二维码关注

当交通遇上机器学习

关注

3
点赞
踩
57

收藏

觉得还不错? 一键收藏
打赏
0
评论
Keras之ConvLSTM参数详解——可以套模型了！

keras中的ConvLSTM layer参数详解。1、最重要的输入尺寸和输出尺寸以data_format='channels_last'为例：输入尺寸：输入 5D 张量...
复制链接

扫一扫