python吃cpu还是显卡_python – 为什么Keras LSTM在CPU上比GPU快三倍？

最新推荐文章于 2024-02-21 19:10:27 发布

weixin_39664560

最新推荐文章于 2024-02-21 19:10:27 发布

阅读量1.3k

点赞数

文章标签： python吃cpu还是显卡

我开始训练神经网络,我发现它太慢了.它几乎比CPU训练慢三倍.

> CPU性能：每个时期8分钟;

> GPU性能：每个时期26分钟.

在此之后我决定在this question on Stackoverflow找到答案并且我应用了CuDNNLSTM(仅在GPU上运行)而不是LSTM.

因此,GPU性能每个时期仅变为1分钟,模型的准确度降低3％.

问题：

1)有人知道为什么GPU在经典LSTM层中的工作速度比CPU慢吗？我不明白为什么会这样.

2)为什么当我使用CuDNNLSTM代替LSTM时,训练变得更快,模型的准确性会降低？

P.S：

我的CPU：Intel Core i7-7700处理器(8M高速缓存,高达4.20 GHz)

我的GPU：nVidia GeForce GTX 1050 Ti(4 GB)

解决方法:

猜测它只是一个不同的,更好的实现,如果实现不同,你不应该期望相同的结果.

通常,在GPU上有效地实现算法很困难并且获得最大性能需要特定于体系结构的实现.因此,如果针对Nvidia GPU的特定实现与GPU的一般实现相比具有增强的性能,那就不足为奇了.同样也不足为奇的是,Nvidia会为加速他们的GPU代码而不是一个致力于一般CNN实施的团队吸收更多资源.

另一种可能性是后端使用的数据类型已从双精度浮点数变为单半精度或甚至半精度浮点数.较小的数据类型意味着您可以以准确性为代价更快地处理更多数字.对于NN应用,这通常是可接受的,因为没有单个数量需要对网络特别准确以产生可接受的结果.

标签：python,tensorflow,gpu,keras,machine-learning

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39664560

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

[Python人工智能] 四十二.命名实体识别 (3)基于Bert+BiLSTM-CRF的中文实体识别万字详解（异常解决中）

杨秀璋的专栏

03-05

971

从本专栏开始，作者正式研究Python深度学习、神经网络及人工智能相关知识。前文讲解如何实现中文命名实体识别研究，构建BiGRU-CRF模型实现。这篇文章将继续以中文语料为主，介绍融合Bert的实体识别研究，使用bert4keras和kears包来构建Bert+BiLSTM-CRF模型。然而，该代码最终结果有些问题，目前还在解决中，但现阶段方法先作为在线笔记分享出来。基础性文章，希望对您有帮助，如果存在错误或不足之处，还请海涵。且看且珍惜！

python运行速度和cpu还是gpu有关_为什么这个Python脚本在CPU中比在GPU中运行得更快？...

weixin_36052776的博客

02-04

1792

我正在使用Python的库somoclu来使用Python训练自组织映射。该库允许用户在CPU(Intel Core i7-8700)或GPU(GeForce GTX 1080 Ti)上执行培训。在我注意到CPU运行脚本的速度比GPU快，所以我运行了一次扫描，改变了数据点的数量和映射的大小，以查看GPU是否在某个时刻优于CPU。这是剧本：import numpy as npimport somoc...

参与评论您还未登录，请先登录后发表或查看评论

C#，LTSM基本原理的实现代码（CPU），学习LTSM的好材料

最新发布

03-21

长短期记忆网络（LSTM，Long Short-Term Memory）是一种时间循环神经网络，是为了解决一般的RNN（循环神经网络）存在的长期依赖问题而专门设计出来的，所有的RNN都具有一种重复神经网络模块的链式形式。在标准RNN中，这个重复的结构模块只有一个非常简单的结构，例如一个tanh层。LSTM是一种含有LSTM区块（blocks）或其他的一种类神经网络，文献或其他资料中LSTM区块可能被描述成智能网络单元，因为它可以记忆不定时间长度的数值，区块中有一个gate能够决定input是否重要到能被记住及能不能被输出output。图1底下是四个S函数单元，最左边函数依情况可能成为区块的input，右边三个会经过gate决定input是否能传入区块，左边第二个为input gate，如果这里产出近似于零，将把这里的值挡住，不会进到下一层。左边第三个是forget gate，当这产生值近似于零，将把区块里记住的值忘掉。第四个也就是最右边的input为output gate，他可以决定在区块记忆中的input是否能输出。LSTM有很多个版本，其中一个重要的版本是GRU（Gated Re

python代码由CPU - ＞GPU

studyvcmfc的专栏

07-06

494

https://blog.csdn.net/luhouxiang/article/details/103619594

python吃显卡还是内存条_玩天际线吃U还是吃显卡或者还是吃内存？--天际线配置需求个人见解...

weixin_39761195的博客

12-05

463

作为一个天际线的伪萌新，经常能听到天际线的朋友各种问“求各位吧友，群友，水友，基友，我电脑CPU i7XXXX, 内存 XXG,显卡 GTX10XX,能否带的动天际线？”每当看到这个问题，我内心其实是这样的，因为这是深含一个非常哲♂学的世界性难题。内心如图所示下面我就天际线配置问题，在B站作一个建设性总结，当然只是个人见解，理性讨论，切莫人身攻击，因为俺是玻璃心~首先，如果不打算或者非常轻微使用m...

学计算机cpu重要还是显卡重要,玩游戏的过程中究竟是显卡重要还是CPU重要？

weixin_30983965的博客

06-20

651

为了玩游戏，许多玩家不惜重金组装了一台10000元的机器。其中，CPU和图形卡是决定计算机性能的核心硬件。球员尤其受重视。那么在玩游戏的过程中，图形卡或CPU重要吗？如今，板卡制造商GALAXY进行了科普研究。首先，我们需要了解图形卡和CPU在游戏中的工作方式。CPU是计算机的核心部分之一。它的功能主要是解释计算机软件中的计算机指令和处理数据；计算机中的所有操作都是CPU的核心组件，它们读取指令，...

CuDNNLSTM模型与LSTM模型（tensorflow-gpu的使用）

JJJAY

11-19

2751

使用同一数据集，LSTM的耗时比CuDNNLSTM整整慢了8-10倍。

LSTM：使用LSTM对嘈杂的语音文件进行语音活动检测。 LSTM是通过Keras实现的。数据处理使用Python，MATLAB和Bash完成。实验在Johns Hopkins CLSP GPU上完成

02-02

LSTM 使用LSTM对嘈杂的语音文件进行语音活动检测。 LSTM是通过Keras实现的。数据处理使用Python，MATLAB和Bash完成。实验是在Johns Hopkins CLSP GPU上完成的。

timeseries-lstm-keras：基于Jason Brownlee教程，在Keras中使用LSTM递归神经网络在Python中进行时间序列预测

02-04

在这个项目"timeseries-lstm-keras"中，我们探讨了如何使用Keras库在Python中构建长短期记忆（LSTM）递归神经网络来进行时间序列预测。LSTM是一种特殊的循环神经网络（RNN），特别适合处理具有长期依赖性的序列数据...

唐诗，藏头诗，按需自动生成古诗，基于Keras、LSTM-RNN。文档齐全

05-31

在GPU Tesla K80上，2s/epoch，一共有3w+个epoch。训练时的测试结果令人满意： ==================Epoch 4304===================== 县幽公事稀，上仙晓更高。风行随时朝，还云避倚里。病客与僧闲，来王不鹤星。...

Keras之LSTM源码阅读笔记

silent56_th的博客

06-18

8386

这里目前为止只是博主阅读Keras中LSTM源码的草稿笔记，内容不全，没有清晰的逻辑，只是堆砌个人想法。参考文献： 1. keras的官方相关文档 2. LSTM原论文 3. keras的RNN源码1. 接口研究1.1. Recurrent接口Recurrent是LSTM的父类（实际是通过SimpleRNN间接继承），定义所有RNNs的统一接口。1.1.1. implementation:im

部署运行keras LSTM模型windows内存不足

qq_38679824的博客

01-15

1178

在服务器上部署运行基于keras的LSTM模型时，使用list保存模型预测结果，导致内存溢出（32G）。解决方案：一边运行一边存储数据，不再等所有训练完成之后再进行存储。 ...

Keras中指定显卡或者显存使用以及强制使用CPU的方法

qwertyu_1234567的博客

04-10

882

在模型训练以及模型推断中，我们经常需要使用指定编号的显卡或者限制显存的使用大小，亦或不用GPU，只用CPU。具体方法如下： 1.指定使用一块或多块GPU： import os os.environ["CUDA_VISIBLE_DEVICES"]="0,2" #指定第1,3块GPU 2.指定显卡并控制显存使用量： import os import tensorflow as t...

[当人工智能遇上安全] 12.易学智能GPU搭建Keras环境实现LSTM恶意URL请求分类

杨秀璋的专栏

02-21

983

这篇文章将简单讲解易学智能GPU搭建Keras环境的过程，并实现了LSTM文本分类的实验，本来想写Google Colab免费云，但看知乎评价也不太好（梯子常断网、时间限制、数据量小）。因此，选择一个评价较好的平台供大家学习（6块一小时），也希望大家推荐更好的平台，百度飞浆后续准备也学习下，希望这篇文章能解决自身电脑配置不足，需要GPU运行模型且服务器价格又不是太高的同学，加油！

【机器学习】LSTM算法原理及加速算法

kouqikamalu的博客

06-03

2654

LSTM算法介绍这里有一本书，是由Jason Brownlee所著《Long Short Term Memory Networks with Python》，里面详细介绍了lstm相对于mlp的优势及前向后向算法。下面给出我的csdn链接（感谢支持）和百度云链接，大家按需自取就好。 https://download.csdn.net/download/kouqikamalu/19359306 链接：https://pan.baidu.com/s/1kT0KAGGNew3BkFByi6os2A

Python利用GPU加速代码进行深度学习

wuicer的博客

03-23

2402

Python利用GPU加速代码进行深度学习，需要安装CUDA、CUDNN、Pytorch

CPU和GPU训练耗时比较

temp_X的博客

05-07

2997

网络训练耗时为什么要用GPU训练网络 CPU 训练是在载入图片并进行处理后再开始训练网络，而利用GPU 训练是在CPU 载入图片处理后利用GPU 进行网络训练，GPU 训练速度更快且后面的图片加载不受音响为什么要用tf.data方法训练不适用多线程方法，读取图片较慢，大多数情况下GPU 都在空闲状态，使用多线程方法可以提图片读取处理速度，使得CPU和GPU更好搭配，缩短训练时间，利用缓存也可以提升CPU读取和处理图片的速率。（提前读取图片放在内存中，内存得足，但效果没有使用多线程明显。） ..

为什么keras LSTM使用GPU无法加速？

坚持的力量

08-23

6116

在做实验的过程中，如果不用gpu的话，我的lstm跑一遍的时间是2分钟半，在网上找了好多资料，但是中文网也没人说这个问题，然后我以为是因为keras在使用gpu上出了问题，但是经过测试，我所使用的平台也有gpu 那么就是keras以及网络自身的问题了然后我找到了一个回答那就是用CuDNNLSTM代替LSTM keras官方文档 Fast LSTM implementation with C...