keras使用multi_gpu_model多GPU拆分batshsize

最新推荐文章于 2022-03-22 15:06:43 发布

22岁，是学生

最新推荐文章于 2022-03-22 15:06:43 发布

阅读量1.7k

点赞数

文章标签：深度学习 gpu

本文链接：https://blog.csdn.net/q978090365/article/details/108595991

版权

本文介绍了如何使用Keras的multi_gpu_model函数在具有多块GPU的环境中提高训练速度，确保GPU利用率。通过示例代码，讨论了在使用该功能时可能遇到的问题，如模型权重加载的顺序、不能指定GPU以及modelcheckpoint回调函数的错误，并提供了相应的解决方案。

摘要由CSDN通过智能技术生成

先来看最终效果

两块卡GPU的利用率都会占满，训练速度会肉眼可见的提升

在此之前使用python的os库自带的GPU分配，代码如下

os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"  # 按照PCI_BUS_ID顺序从0开始排列GPU设备
os.environ["CUDA_VISIBLE_DEVICES"] = "1,0"  # 设置当前使用的GPU设备

如果只使用这两行代码会出现仍然是单块卡的占用率跑满，另一块卡占用率为0，这种情况并没有真正的将每一个batchsize的数据平分给两块卡，而是简简单单的占用了两个显存。由于深受batchsize过大导致的OOM痛苦，所以查了keras的官方文档发现了multi_gpu_model这个函数，当然还有多分支设备并行的方法，目前还没用到，用到之后再写。

keras官方给了分配多显卡的函数multi_gpu_model，简单来说就是一行代码

from keras.utils import multi_gpu_model
model = multi_gpu_model(ori_model, gpus=2)

针对keras不同的版本可能import的方式不相同，具体方式可以自行百度。亲测tensorflow-gpu=1.4.0 keras=2.1.5（不使用官方对应版本2.0.8的原因是2.0.8版本并未找到此函数）以及tensorflow-gpu=

最低0.47元/天解锁文章

22岁，是学生

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫