keras之多GPU训练方法

最新推荐文章于 2024-08-04 00:19:40 发布

宗而研之

最新推荐文章于 2024-08-04 00:19:40 发布

阅读量6.6k

点赞数 6

分类专栏： # GPU # 深度学习

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/zong596568821xp/article/details/86494916

版权

深度学习同时被 2 个专栏收录

33 篇文章 20 订阅

订阅专栏

GPU

8 篇文章 6 订阅

订阅专栏

在上一篇博客中，我们利用keras框架训练yolov3，训练脚本默认采用的是一块GPU，由于我们有多块GPU，因此可以设置多块GPU训练来加快训练速度。

实现方法很简单，首先在头文件中添加以下内容

from keras.utils import multi_gpu_model

然后找到自己构建网络的地方，在我这里，第一次构建model是以下的语句

if is_tiny_version:
    model = create_tiny_model(input_shape, anchors, num_classes,
        freeze_body=2, weights_path='model_data/tiny_yolo_weights.h5')
else:
    model = create_model(input_shape, anchors, num_classes,
        freeze_body=2, weights_path='model_data/trained_weights_80.h5') # make sure you know what you freeze

然后就找到create_tiny_model和create_model函数，进入函数内部，找到构建model的语句，比如我找create_model()函数，找到以下语句

model_body = yolo_body(image_input, num_anchors//3, num_classes)
print('Create YOLOv3 model with {} anchors and {} classes.'.format(num_anchors, num_classes))

然后在后边添加

model_body = multi_gpu_model(model_body,gpus=2)

表示使用两块GPU

如果想指定使用哪两块GPU，可以在开头添加如下语句

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"

表示使用第3第4块GPU

注意multi_gpu_model这个函数一定要放对位置，否则会报如下的错

tensorflow.python.framework.errors_impl.InvalidArgumentError: Can't concatenate scalars (use tf.stack instead) for 'yolo_loss_1/concat' (op: 'ConcatV2') with input shapes: [], [], [], [].