python多显卡支持_keras多显卡训练方式

最新推荐文章于 2020-12-11 12:38:52 发布

weixin_39779928

最新推荐文章于 2020-12-11 12:38:52 发布

阅读量204

点赞数

文章标签： python多显卡支持

使用keras进行训练，默认使用单显卡，即使设置了os.environ['CUDA_VISIBLE_DEVICES']为两张显卡，也只是占满了显存，再设置tf.GPUOptions(allow_growth=True)之后可以清楚看到，只占用了第一张显卡，第二张显卡完全没用。

要使用多张显卡，需要按如下步骤：

(1)import multi_gpu_model函数：from keras.utils import multi_gpu_model

(2)在定义好model之后，使用multi_gpu_model设置模型由几张显卡训练，如下：

?

通过以上代码，model将作为CPU上的原始模型，而model_parallel将作为拷贝模型被复制到各个GPU上进行梯度计算。如果batchsize为128，显卡n=2，则每张显卡单独计算128/2=64张图像，然后在CPU上将两张显卡计算得到的梯度进行融合更新，并对模型权重进行更新后再将新模型拷贝到GPU再次训练。

(3)从上面可以看出，进行训练时，仍然在model_parallel上进行：

model_parallel.fit(...) #注意是model_parallel

(4)保存模型时，model_parallel保存了训练时显卡数量的信息，所以如果直接保存model_parallel的话，只能将模型设置为相同数量的显卡调用，否则训练的模型将不能调用。因此，为了之后的调用方便，只保存CPU上的模型，即model:

model.save(...) #注意是model，不是model_parallel

如果用到了callback函数，则默认保存的也是model_parallel(因为训练函数是针对model_parallel的)，所以要用回调函数保存model的话需要自己对回调函数进行定义：

?

定以后具体使用如下：

checkpoint=OwnCheckpoint(model)

model_parallel.fit_generator(...,callbacks=[checkpoint])

这样就没问题了！

补充知识：keras.fit_generator及多卡训练记录

1.环境问题

使用keras，以tensorflow为背景，tensorflow1.14多卡训练会出错 python3.6

2.代码

2.1

os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"

os.environ['CUDA_VISIBLE_DEVICES'] = '4,5'

2.2 自定义generator函数

?

2.3 函数调用及训练

?

3. 多卡训练

3.1 复制model

model_parallel = multi_gpu_model(model, gpus=2)

3.2 checkpoint 定义

?

使用

model_checkpoint = ParallelModelCheckpoint(model=model, filepath=filepath, monitor='val_loss',verbose=1, save_best_only=True, mode='min')

3.3 注意的问题

保存模型是时候需要使用以原来的模型保存，不能使用model_parallel保存

以上这篇keras多显卡训练方式就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持服务器之家。

原文链接：https://blog.csdn.net/u010122972/article/details/84784245

weixin_39779928

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python多显卡支持_keras多显卡训练方式

使用keras进行训练，默认使用单显卡，即使设置了os.environ['CUDA_VISIBLE_DEVICES']为两张显卡，也只是占满了显存，再设置tf.GPUOptions(allow_growth=True)之后可以清楚看到，只占用了第一张显卡，第二张显卡完全没用。要使用多张显卡，需要按如下步骤：(1)import multi_gpu_model函数：from keras.utils i...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。