利用Bidirectional LSTM实现数据集MNIST的分类

最新推荐文章于 2023-02-16 09:26:34 发布

cy冲鸭

最新推荐文章于 2023-02-16 09:26:34 发布

阅读量1k

点赞数 1

分类专栏：自然语言处理

本文链接：https://blog.csdn.net/weixin_41841797/article/details/84310664

版权

双向循环神经网络（Bidirectional Recurrent Neural Networks，Bi-RNN）的核心是把一个普通的单向的RNN拆分成两个方向，一个随着时间序列正向的，一个逆着时间序列反向的。这样当前时间节点的输出就可以同时利用正向、反向两个方向的信息，而不像普通RNN需要等到后面时间节点才可以获取未来时间信息。这两个不同方向的RNN之间不会共用state，它们之间没有直接连接。每一个时间的输入会分别传到正向和反向的RNN中，它们根据各自的状态产生输出，这两份输出会一起连接到Bi-RNN的输出节点，共同合成最终输出。

利用TensorFlow实现一个Bidirectional LSTM Classifier，并在MNIST数据集上测试。代码来自TensorFlow-Examples的开源实现。

https://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/bidirectional_rnn.py

from __future__ import print_function

import tensorflow as tf
from tensorflow.contrib import rnn
import numpy as np

# Import MNIST

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

cy冲鸭

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

【图像分类】基于PyTorch搭建LSTM实现MNIST手写数字体识别（双向LSTM，附完整代码和数据集）

学无止境、积少成多、厚积薄发

02-13

1504

基于PyTorch搭建LSTM实现MNIST手写数字体识别（双向LSTM，附完整代码和数据集）

【37】使用LSTM实现文本分类、图像分类、图像生成任务

Clichong

05-12

1万+

如有错误，恳请指出。在上一篇文章中，使用了LSTM来预测时序信息，但是在自然语言处理领域中，LSTM可以用来进行文本预测，大体上的思路是将batch个文本，每个文本的seq个词汇编码为hidden dim长度的特征向量，所以最后的特征维度是[seq, batch, hidden dim]，就可以作为输入数据。提取LSTM最后的一个隐藏单元[batch, hidden dim]，再使用一个全连接层就可以实现分类。而对于图像来说，其信息维度都很熟悉了，[batch, c, h, w]，那么其实也可以是将.

参与评论您还未登录，请先登录后发表或查看评论

基于tensorflow的Bidirectional LSTM实现MNIST分类

u012329554的博客

05-12

260

基于tensorflow的Bidirectional LSTM实现MNIST分类 #%% # Copyright 2015 The TensorFlow Authors. All Rights Reserved. # # Licensed under the Apache License, Version 2.0 (the "License"); # you may not use this file except in compliance with the License. # You may ob

lstm结构图_LSTM模型结构的可视化

weixin_39529463的博客

11-20

6618

目录： 1、传统的BP网络和CNN网络 2、LSTM网络 3、LSTM的输入结构 4、pytorch中的LSTM 4.1 pytorch中定义的LSTM模型 4.2 喂给LSTM的数据格式 4.3 LSTM的output格式 5、LSTM和其他网络组合最近在学习LSTM应用在时间序列的预测上，但是遇到一个很大的问题就是LSTM在传统BP网络上加上时间步后，其结构就很难理解了，同时其输入输出数据格式...

SemEval2019Task3_ERC | (5) Bidirectional LSTM Network for Contextual ERC

sdu_hao的博客

02-12

1006

原文下载提取码:bjab 开源代码目录 1. 比赛介绍 2. 模型描述 3. 实验 4. 代码 1. 比赛介绍 SemEval2019Task3_ERC是2019年Semantic Evaluation的第三个任务，对话情感识别。使用的数据集是EmoContext，该对话数据集为纯文本数据集，来自社交平台。分为训练集、验证集和测试集。其中训练集、验证集、测试集各包含30,1...

基于LSTM和词嵌入的tweet文本分类

TensorFlowNews

09-14

779

作者|Emmanuella Anggi 编译|VK 来源|Towards Data Science 在这篇文章中，我将详细介绍如何使用fastText和GloVe作单词嵌入到LSTM模型上进行文本分类。我在写关于自然语言生成的论文时对词嵌入产生了兴趣。词嵌入提高了模型的性能。在本文中，我想看看每种方法（有fastText和GloVe以及不使用）对预测的影响。在我的Github代码中，我还将结果与CNN进行了比较。我在这里使用的数据集来自Kaggle，由tweets组成，标签是表明推特是否是灾难性推特（

【读】关系抽取—（1）Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification

imsuhxz的博客

10-22

8708

学习本无底，前进莫徬徨。这是一篇Relation Classification相关的paper，出自于中科大自动化所 Zhou ，Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification。收录于ACL 2016。目录 Abstract 1 Introductio...

【图像分类】基于PyTorch搭建GRU实现MNIST手写数字体识别（单/双向GRU，附完整代码和数据集）

学无止境、积少成多、厚积薄发

02-16

1481

基于PyTorch搭建单向GRU和双向GRU实现MNIST手写数字体识别（附完整代码和数据集）

LSTM理解

莫一丞元

09-06

263

背景本文按照RNN和LSTM（1997年提出）进行对比、LSTM的标准流程、LSTM的常见变种、为什么LSTM不会出现梯度爆炸或梯度消失？、双向LSTM、深度双向LSTM的脉络进行记述。由于常见的RNN随着序列的增长产生梯度爆炸或梯度消失问题，导致在实际应用过程中并不能学习到间隔太远的输入，从而诞生了LSTM。 RNN和LSTM对比下面是一些必要的图示： LSTM标准流程 LSTM的常见变种为什么LSTM不会出现梯度爆炸或梯度消失？双向LSTM（Bi-directional

序列模型简介——RNN, Bidirectional RNN, LSTM, GRU

云栖社区

02-10

598

既然我们已经有了前馈网络和CNN，为什么我们还需要序列模型呢？这些模型的问题在于，当给定一系列的数据时，它们表现的性能很差。序列数据的一个例子是音频的剪辑，其中包含一系列...

双向长短时记忆循环神经网络详解（Bi-directional LSTM RNN）

热门推荐

James Zhang's Blog

07-21

16万+

1. Recurrent Neural Network (RNN)尽管从多层感知器（MLP）到循环神经网络（RNN）的扩展看起来微不足道，但是这对于序列的学习具有深远的意义。循环神经网络（RNN）的使用是用来处理序列数据的。在传统的神经网络中模型中，层与层之间是全连接的，每层之间的节点是无连接的。但是这种普通的神经网络对于很多问题是无能为力的。比如，预测句子的下一个单词是什么，一般需要用到前面的单词

深度学习核心技术精讲100篇（八）-keras 实战系列之深度学习中的多任务学习(Multi-task learning)

wenyusuran的专栏

10-07

2185

多任务学习(Multi-task learning)简介多任务学习(Multi-task learning)是迁移学习（Transfer Learning）的一种，而迁移学习指的是将从源领域的知识（source domin）学到的知识用于目标领域(target domin)，提升目标领域的学习效果。而多任务学习也是希望模型同时做多个任务时，能将其他任务学到的知识，用于目标任务中，从而提升目标任务效果。如果我们换个角度理解，其实多任务学习，其实是对目标任务做了一定的约束，或者叫做regulariza

RNN--Bidirectional LSTM Network

wydbyxr的博客

11-01

2877

Bidirectional LSTM Network

Tensorflow 使用Bidirectional()包装器构建双向LSTM模型，预测DNA序列功能

XH生信和机器学习空间

02-11

2671

循环神经网络（RNN) 循环神经网络RNN能处理时间序列，过去几年中，应用 RNN 在语音识别，语言建模，翻译，图片描述等问题上已经取得一定成功，并且这个列表还在增长。RNN模型的一个代表是LSTM ，这是一种特别的 RNN，比标准的 RNN 在很多的任务上都表现得更好，因此获得了非常多的应用。值得一提的是，lstm的作者也Jürgen Schmidhuber 也是机器学习领域的大牛，名气比三巨头...

Tensorflow实现基于Bidirectional LSTM Classifier

河南骏的博客

01-16

1773

数据集是在mnist上进行测试。先载入 Tensorflow、Numpy，以及Tensorflow自带的MNIST数据读取器。我们直接使用input_data.read_data_sets下载并读取mnist数据集。 import tensorflow as tf import numpy as np from tensorflow.examples.tutorials.mnist impo

使用Bidirectional LSTM 做时间序列进行预测

qq_39942537的博客

10-19

4306

使用Bidirectional LSTM 做时间序列进行预测 univariate bidirectional lstm example from numpy import array from keras.models import Sequential from keras.layers import LSTM from keras.layers import Dense from keras...

TensorFlow实战12：Bidirectional LSTM Classifier

Felaim的博客

04-20

1万+

1.双向递归神经网络简介双向递归神经网络（Bidirectional Recurrent Neural Networks， Bi-RNN）,是由Schuster和Paliwal于1997年首次提出的，和LSTM是在同一年被提出的。Bi-RNN的主要目标是增加RNN可利用的信息。RNN无法利用某个历史输入的未来信息，Bi-RNN则正好相反，它可以同时使用时序数据中某个输入的历史及未来数据。 Bi-R

rnn与gru， lstm, bi-lstm代码差异

q_xiami123的博客

05-10

575

rnn 与gru区别两者网络接口相同，只需要在网络定义里替换一下相互名字即可 self.gru = nn.GRU(input_size, hidden_size, num_layers, batch_first=True) self.rnn = nn.RNN(input_size, hidden_size, num_layers, batch_first=True) 其它输入数据和输出接口保持不变 rnn与lstm区别 rnn与lstm网络接口定义一样，只是换接口名称，但是lstm前向增加了cell_s

利用BiLSTM实现情感分类三分类

最新发布

03-30

BiLSTM是一种常用的深度学习模型，可以用于文本分类任务。在情感分类任务中，可以利用BiLSTM对文本进行表示学习，进而进行情感分类。以下是一种利用BiLSTM实现情感分类三分类的示例代码： 1. 准备数据首先需要准备情感分类的数据集。假设数据集包含两个字段：text和label。其中text是一个字符串，表示文本内容；label是一个整数，表示文本的情感分类，取值为0、1、2。可以使用pandas库读取数据集，并将text和label分别存储到两个列表中。 import pandas as pd data = pd.read_csv('sentiment.csv') texts = data['text'].tolist() labels = data['label'].tolist() 2. 分词和向量化接下来需要对文本进行分词和向量化。可以使用分词工具jieba和词向量库gensim进行处理。 import jieba from gensim.models import Word2Vec # 分词 texts_cut = [jieba.lcut(text) for text in texts] # 训练词向量模型 model = Word2Vec(texts_cut, size=100, window=5, min_count=1) # 将文本转换为词向量序列 texts_vec = [] for text in texts_cut: vec = [] for word in text: if word in model.wv.vocab: vec.append(model[word]) texts_vec.append(vec) 3. 构建模型构建BiLSTM模型，用于情感分类。 from keras.models import Sequential from keras.layers import Embedding, Bidirectional, LSTM, Dense # 定义模型 model = Sequential() model.add(Embedding(input_dim=len(model.wv.vocab), output_dim=100, input_length=None)) model.add(Bidirectional(LSTM(128, dropout=0.2, recurrent_dropout=0.2))) model.add(Dense(3, activation='softmax')) # 编译模型 model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy']) 4. 训练模型使用上一步中构建的模型对数据进行训练。 import numpy as np from keras.utils import to_categorical # 将标签转换为one-hot编码 labels_onehot = to_categorical(labels, num_classes=3) # 训练模型 model.fit(np.array(texts_vec), labels_onehot, batch_size=32, epochs=10, validation_split=0.2) 5. 预测结果使用训练好的模型对新的文本进行情感分类。 # 对新文本进行分词和向量化 text_new = '这家餐厅很好吃' text_new_cut = jieba.lcut(text_new) text_new_vec = [] for word in text_new_cut: if word in model.wv.vocab: text_new_vec.append(model[word]) # 预测结果 result = model.predict(np.array([text_new_vec])) label_new = np.argmax(result) print('新文本的情感分类为：', label_new) 以上就是利用BiLSTM实现情感分类三分类的示例代码。需要注意的是，这只是一种示例代码，具体实现可能因数据集、模型结构等因素而有所不同。