tensorflow gpu利用率低_TensorFlow 的自动混合精度，可提升在 NVIDIA GPU 上 AI 训练速度...

最新推荐文章于 2022-10-05 16:26:36 发布

weixin_39732716

最新推荐文章于 2022-10-05 16:26:36 发布

阅读量650

点赞数

文章标签： tensorflow gpu利用率低

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39732716/article/details/111362195

版权

本文介绍了如何通过TensorFlow的自动混合精度功能提高NVIDIA GPU上的AI训练速度，利用半精度数据类型加速训练，同时保持模型精度。在启用自动混合精度后，配合XLA编译器和适当调整小批量大小，可以显著提升GPU利用率。

摘要由CSDN通过智能技术生成

文 / NVIDIA

混合精度训练利用半精度来加速训练，在某些情况下，能够获得与使用相同超参数进行单精度训练相同的精度。内存要求也因此降低，从而可以运行更大的模型和进行小批量处理。

启用混合精度需要完成两个步骤：移植模型，以在适当的时候使用半精度数据类型；使用损失缩放技术保留小的梯度值。我们为 TensorFlow 引入自动混合精度功能(现可在 1.x 中使用，不久后即可在 2.x 中使用)，该功能使用 NVIDIA Volta 和 Turing GPU 中的 Tensor Core 进行修改，以提升训练性能。自动混合精度在 TensorFlow 内部通过 NVIDIA NGC Container 中的一个环境变量完成这两个步骤，并在必要时采取更精细的控制。

为现有的 TensorFlow 模型脚本启用此功能需要设置一个环境变量，或者只需更改几行代码。我们发现对于数学运算量大的模型，运算速度提高了 3 倍，但具体能获得多少程度的加速取决于模型架构。现在，TensorFlow 容器内提供自动混合精度功能，而 TensorFlow 容器可在 NVIDIA NGC 容器注册表中取得(https://ngc.nvidia.com/catalog/containers/nvidia:tensorflow)。

要在容器中启用此功能，只需设置一个环境变量即可：

export TF_ENABLE_AUTO_MIXED_PRECISION=1

或者，您也可以在 TensorFlow Python 脚本中设置该环境变量：

os.environ[‘TF_ENABL

最低0.47元/天解锁文章

weixin_39732716

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。