模型训练中，不调用gpu比调用gpu更快的情况

要硕果累累呀

已于 2022-10-14 20:18:10 修改

阅读量2.2k

点赞数 2

分类专栏：深度学习文章标签：深度学习 tensorflow 人工智能

于 2022-09-29 20:30:09 首次发布

转载请标明出处

本文链接：https://blog.csdn.net/weixin_43976737/article/details/127112778

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

模型训练中，不调用gpu比调用gpu更快的情况

背景
原因
个人实验测试
- 小规模神经网络模型（GPU比CPU慢）
- 加深加宽隐藏层（GPU优势逐渐体现）
补充

背景

近来，跑语音情感识别和遗传算法的结合，需要大量的计算，一开始想着用gpu跑能快很多，结果发现调用gpu居然没有只用cpu更快。6代每代5个个体，合着总共30次训练，调用gpu居然比不调用gpu慢了接近一分钟。

不使用gpu：
在这里插入图片描述
使用gpu：

原因

数据传输会有很大的开销，而GPU处理数据传输要比CPU慢，而GPU的专长矩阵计算在小规模神经网络中无法明显体现出来。

1.GPU擅长像卷积、填充的矩阵运算，常用于计算机视觉，在语音情感识别中没有太多卷积需要运算，导致时间短板在传输上，gpu节省的时间甚至没有弥补掉传输时间的损耗。

2.模型规模过小，看似和遗传算法相结合规模变大了。但是每一次单独训练的时间都是一样的，在计算时间上，遗传算法可以理解为多次运行同一个训练，即次数*单次训练时间。次数定好了，单次训练时间cpu>gpu.所以对整体来说使用cpu快于gpu。

个人实验测试

自己已经开启gpu的项目可以使用如下代码关闭gpu来进行对比：

import os
os.environ["CUDA_VISIBLE_DEVICES"]="-1" ###指定此处为-1即可

小规模神经网络模型（GPU比CPU慢）

#TensorFlow and tf.keras
import tensorflow as tf
#Helper libraries
import numpy as np
import matplotlib.pyplot as plt
from time import time

mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

#用CPU运算
startTime1 = time()

with tf.device('/cpu:0'):
    model = tf.keras.models.Sequential([
      tf.keras.layers.Flatten(input_shape=(28, 28)),
      tf.keras.layers.Dense(128, activation='relu'),
      tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(10, activation='softmax')
    ])
    model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    model.fit(x_train, y_train, epochs=10)
    model.evaluate(x_test, y_test)
t1 = time() - startTime1

#用GPU运算
startTime2 = time()

with tf.device('/gpu:0'):
    model = tf.keras.models.Sequential([
      tf.keras.layers.Flatten(input_shape=(28, 28)),
      tf.keras.layers.Dense(128, activation='relu'),
      tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(10, activation='softmax')
    ])
    model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    model.fit(x_train, y_train, epochs=10)
    model.evaluate(x_test, y_test)

t2 = time() - startTime2

#打印运行时间
print('使用cpu花的时间：', t1)
print('使用gpu花的时间：', t2)

结果：

使用cpu花的时间： 52.422937631607056
使用gpu花的时间： 122.77410888671875

加深加宽隐藏层（GPU优势逐渐体现）

#TensorFlow and tf.keras
import tensorflow as tf
#Helper libraries
import numpy as np
import matplotlib.pyplot as plt
from time import time

mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

#CPU运行
startTime1 = time()

with tf.device('/cpu:0'):
    model = tf.keras.models.Sequential([
      tf.keras.layers.Flatten(input_shape=(28, 28)),
      tf.keras.layers.Dense(1000, activation='relu'),
      tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(1000, activation='relu'),
      tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(10, activation='softmax')
    ])
    model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    model.fit(x_train, y_train, epochs=10)
    model.evaluate(x_test, y_test)

t1 = time() - startTime1

#GPU运行
startTime2 = time()

with tf.device('/gpu:0'):
    model = tf.keras.models.Sequential([
      tf.keras.layers.Flatten(input_shape=(28, 28)),
      tf.keras.layers.Dense(1000, activation='relu'),
      tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(1000, activation='relu'),
      tf.keras.layers.Dropout(0.2),
      tf.keras.layers.Dense(10, activation='softmax')
    ])

    model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    
    model.fit(x_train, y_train, epochs=10)
    model.evaluate(x_test, y_test)

t2 = time() - startTime2

#打印运行时间
print('使用cpu花的时间：', t1)
print('使用gpu花的时间：', t2)

结果：

使用cpu花的时间： 390.03080129623413
使用gpu花的时间： 224.40780639648438

补充

后来听师哥说，是语音模型调用调用gpu也会加快速度，怀疑是tensorflow而没用tensorflow-gpu原因。
但是tensorflow2.0以后不就是不区分gpu版本了，抱着试试看的态度，分别装了tensorflow2.80和tensorflow-gpu两个版本，结果没差。（但是以后以防万一，能按tensorflow-gpu尽量不要按tensorflow，毕竟多打三个字母又不费啥）

后来发现就是项目问题
一、如果加宽隐藏层，会减少时间。
在这里插入图片描述