Tensorflow tf.keras.layers.LSTM

最新推荐文章于 2023-04-07 22:00:48 发布

Claroja

最新推荐文章于 2023-04-07 22:00:48 发布

阅读量1.4w

点赞数 6

分类专栏： TensorFlow 文章标签： tensorflow

本文链接：https://blog.csdn.net/claroja/article/details/96877918

版权

TensorFlow 专栏收录该内容

43 篇文章 3 订阅

订阅专栏

参数

参数	描述
units	输出空间的维度
input_shape	(timestep, input_dim),timestep可以设置为None,由输入决定,input_dime根据具体情况
activation	激活函数,默认tanh
recurrent_activation
use_bias
kernel_initializer
recurrent_initializer
bias_initializer
unit_forget_bias
kernel_regularizer
recurrent_regularizer
bias_regularizer
activity_regularizer
kernel_constraint
recurrent_constraint
bias_constraint
dropout
recurrent_dropout
implementation
return_sequences
return_state
go_backwards
stateful
unroll

例子

keras.layers.LSTM(units=200,input_shape=(None,1),return_sequences=True)

init

__init__(
    units,
    activation='tanh',
    recurrent_activation='sigmoid',
    use_bias=True,
    kernel_initializer='glorot_uniform',
    recurrent_initializer='orthogonal',
    bias_initializer='zeros',
    unit_forget_bias=True,
    kernel_regularizer=None,
    recurrent_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    recurrent_constraint=None,
    bias_constraint=None,
    dropout=0.0,
    recurrent_dropout=0.0,
    implementation=2,
    return_sequences=False,
    return_state=False,
    go_backwards=False,
    stateful=False,
    time_major=False,
    unroll=False,
    **kwargs
)

原理

在这里插入图片描述
$\hat{c}^{<t>}$ 是记忆状态,对应矩阵形状( $u n i t s * f e a t u r e s + u n i t s * u n i t s + b i a s$ )

$\Gamma_u$ 为更新门(update),形状是 $(u n i t s * f e a t u r e s + u n i t s * u n i t s + b i a s)$

$\Gamma_f$ 为更新门(forget),形状是 $(u n i t s * f e a t u r e s + u n i t s * u n i t s + b i a s)$

$\Gamma_o$ 为输出门(out),形状是 $(u n i t s * f e a t u r e s + u n i t s * u n i t s + b i a s)$

所以LSTM的参数个数是: $(u n i t s * f e a t u r e s + u n i t s * u n i t s + u n i t s) * 4$

参考：
官网
https://blog.csdn.net/jiangpeng59/article/details/77646186
https://www.zhihu.com/question/41949741?sort=created
https://stackoverflow.com/questions/38080035/how-to-calculate-the-number-of-parameters-of-an-lstm-network/56614978#56614978
https://stackoverflow.com/questions/46584171/why-does-the-first-lstm-in-a-keras-model-have-more-params-than-the-subsequent-on