Tensorflow2.0笔记 - LSTM做IMDB数据集分析

        本笔记记录使用LSTMCell做IMDB情感分析,代码和前一个笔记使用SimpleRNN的代码基本一致,除了创建state的时候tensor的list包含两个状态参数外,基本没有任何区别。

import os
import time
import numpy as np
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets, layers, optimizers, Sequential, metrics, Input

os.environ['TF_CPP_MIN_LOG_LEVEL']='2'
#tf.random.set_seed(12345)
#np.random.seed(22)
tf.__version__

#取常见的10000个单词
total_words = 10000
#句子最长的单词数量设置为80
max_review_len = 80
#embedding设置为100,表示每个单词用100维向量表示
embedding_len = 100
#加载IMDB数据集
(x_train,y_train), (x_test, y_test) = datasets.imdb.load_data(num_words = total_words)
#对训练数据和测试数据的句子进行填充或截断
x_train = keras.preprocessing.sequence.pad_sequences(x_train, maxlen=max_review_len)
x_test = keras.preprocessing.sequence.pad_sequences(x_test, maxlen=max_review_len)

#构建数据集
batchsize = 128
db_train = tf.data.Dataset.from_tensor_slices((x_train, y_train))
db_train = db_train.shuffle(1000).batch(batchsize, drop_remainder=True)
db_test = tf.data.Dataset.from_tensor_slices((x_test, y_test))
db_test = db_test.batch(batchsize, drop_remainder=True)

#x_train包含25000个句子,每个句子包含80个单词,y_train标签为1表示好评,0表示差评
print('x_train: shape - ', x_train.shape, ' y_train: max/min -', tf.reduce_max(y_train).numpy(), '/', tf.reduce_min(y_train).numpy())
print('x_test: shape - ', x_test.shape)

class MyLSTM(keras.Model):
    #units:state的维度
    def __init__(self, total_words, embedding_len, max_review_len, units):
        super(MyLSTM, self).__init__()
        #初始的序列状态初始化为0(第0时刻的状态)h, c
        self.state0 = [tf.zeros([batchsize, units]), tf.zeros([batchsize, units])]
        self.state1 = [tf.zeros([batchsize, units]), tf.zeros([batchsize, units])]
        #embedding层,将文本转换为embedding表示
        #[b, 80] => [b, 80, 100]
        self.embedding = layers.Embedding(total_words, embedding_len, input_length=max_review_len)
        #[b, 80, 100] , units: 64 - 转换为64维的state [b, 64]
        self.lstm_cell0 = layers.LSTMCell(units, dropout=0.5)
        self.lstm_cell1 = layers.LSTMCell(units, dropout=0.5)
        #全连接层 [[b, 64] => [b, 1]
        self.outlayer = layers.Dense(1)
    #inputs: [b, 80] 
    def call(self, inputs, training=None):
        x = inputs
        #做embedding,[b,80] => [b, 80, 100]
        x = self.embedding(x)
        #做RNN cell计算
        #[b, 80, 100] => [b,  64]
        #遍历句子中的每个单词
        # word: [b, 100]
        state0 = self.state0
        state1 = self.state1
        for word in tf.unstack(x, axis=1):
            #h1 = x*w_xh + h0*w_hh
            out0, state0 = self.lstm_cell0(word, state0, training)
            out1, state1 = self.lstm_cell1(out0, state1, training)
        #循环完毕后,得到的out为[b, 64],表示每个句子最终得到的状态
        x = self.outlayer(out1)
        #计算最终评价结果
        prob = tf.sigmoid(x)
        return prob

def main():
    units = 64
    epochs = 5
    lr = 0.001

    model = MyLSTM(total_words, embedding_len, max_review_len, units)
    model.compile(optimizer = optimizers.Adam(lr), loss = tf.losses.BinaryCrossentropy(),
                 metrics=['accuracy'])
    model.fit(db_train, epochs=epochs, validation_data=db_test)

    model.evaluate(db_test)

if __name__ == '__main__':
    main()

运行结果:

 

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
tensorflow2 cnn-lstm-attention是一个GitHub项目的名称,该项目是基于TensorFlow 2框架,实现了一个结合了卷积神经网络(CNN)、长短期记忆网络(LSTM)以及注意力机制(Attention)的模型。 首先,TensorFlow 2是一个深度学习框架,它提供了强大的工具和库,用于构建和训练各种神经网络模型。CNN是一种用于图像处理的经典神经网络结构,它可以有效地提取图像中的特征。LSTM则是一种能够处理序列数据的循环神经网络,它具有记忆能力,可以捕捉到序列中的长期依赖关系。而Attention机制则可以在序列中自动学习并加权重要的部分,从而改善模型在处理序列数据时的表现。 这个GitHub项目结合了CNN、LSTM和Attention三个模块,旨在提高模型在处理图像序列数据时的性能。具体来说,它使用CNN作为特征提取层,将输入的图像序列转化为特征序列。然后,这些特征序列被输入到LSTM中进行序列建模,以学习序列中的时间依赖关系。最后,通过Attention机制,模型可以自动关注重要的特征,从而提高模型在处理序列数据时的精度和鲁棒性。 通过这个GitHub项目,用户可以学习和使用TensorFlow 2框架构建CNN-LSTM-Attention模型,并在图像序列处理任务中应用。这个项目可以为用户提供一个完整的代码实现和示例数据集,以及相应的文档和说明,帮助用户理解和运用这个模型。用户可以根据自己的需求对模型进行修改和扩展,以适应不同的应用场景。 总之,tensorflow2 cnn-lstm-attention是一个在GitHub上开源的项目,它基于TensorFlow 2框架,在图像序列处理任务中结合了CNN、LSTM和Attention三个模块,旨在提高模型的性能和表现。这个项目不仅提供了代码实现和示例数据集,还为用户提供了学习和应用这个模型的资料和指导,是一个有价值的资源。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

亦枫Leonlew

希望这篇文章能帮到你

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值