LSTM在Keras和Tensorflow中的统一

最新推荐文章于 2024-05-23 21:29:53 发布

「已注销」

最新推荐文章于 2024-05-23 21:29:53 发布

阅读量3.8k

点赞数 3

分类专栏：机器学习

本文链接：https://blog.csdn.net/weixin_40937909/article/details/79999121

版权

本文记录了将Tensorflow实现的LSTM模型转换为Keras过程中的挑战和解决方案。通过比较Tensorflow和纯Python版本的LSTM，确保在Keras中配置正确，并探讨了两者中激活函数和权重的对应关系。

摘要由CSDN通过智能技术生成

最近想把一个用到Tensorflow的LSTM的模型改成Keras，崩溃，好在解决了问题，小笔记记录一下

目的

让Keras的LSTM的输出
与
Tensorflow的用LSTMCell和dynamic_rnn组成的LSTM结果一样。

首先是固定seed然后做一个简单的tf的LSTM的模型，如下

令人抓狂的过程

Tensorflow参考例

这边的输出当作Keras的配置的正确答案
其权重当作Keras的初始权重看看输出的答案是否与正确答案一样

forget_bias设置为0的原因在于keras中并没有提供。(但是不影响bias的训练)

import tensorflow as tf
from tensorflow.contrib.rnn import LSTMCell, LSTMStateTuple

import numpy as np

np.random.seed(0)
tf.set_random_seed(0)
batch_size = 1
seq_length = 5
inputs = tf.placeholder(shape=[None, seq_length, 1], dtype=tf.float32)

cell = LSTMCell(num_units=1,
                state_is_tuple=True,
                forget_bias=0.0,
                initializer=None)

rnn_outputs, rnn_states = tf.nn.dynamic_rnn(
    cell=cell,
    dtype=tf.float32,
    sequence_length=[seq_length] * batch_size,
    inputs=inputs)

sess = tf.Session()
sess.run(tf.global_variables_initializer())

total_parameters = 0
for variable in tf.trainable_variables():
    print("---- ", variable, " ----")
    print(repr(sess.run(variable)))
print("===========================================")

rnn_outputs_, rnn_states_ = sess.run([rnn_outputs, rnn_states], 
                                     feed

最低0.47元/天解锁文章

「已注销」

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
1
评论
LSTM在Keras和Tensorflow中的统一

最近想把一个用到Tensorflow的LSTM的模型改成Keras，崩溃，好在解决了问题，小笔记记录一下目的让Keras的LSTM的输出与 Tensorflow的用LSTMCell和dynamic_rnn组成的LSTM结果一样。首先是固定seed然后做一个简单的tf的LSTM的模型，如下令人抓狂的过程Tensorflow参考例这边的输出当作Keras的配置...
复制链接

扫一扫