RuntimeError: CUDA out of memory. Tried to allocate 196.00 MiB (GPU 0； 23.65 GiB total capacity； 21.

最新推荐文章于 2024-07-25 10:27:09 发布

pythonSuperman

最新推荐文章于 2024-07-25 10:27:09 发布

阅读量483

点赞数 2

分类专栏：调试安装文章标签：人工智能

本文链接：https://blog.csdn.net/llf000000/article/details/136673576

版权

59 篇文章 1 订阅

订阅专栏

根据提供的代码，可能会出现内存不足的问题。错误信息中显示了“CUDA out of memory”的错误，意味着在GPU上分配内存时超出了可用的内存容量。

在训练过程中，模型的参数和中间结果需要存储在GPU的显存中。如果显存不足以容纳所有的参数和中间结果，就会出现内存不足的错误。

解决这个问题的方法有几种：

减少批量大小（batch size）：减小每个批次中样本的数量，以减少显存的使用量。在命令行中通过--batch-size参数指定较小的值，例如--batch-size 8。
减少模型的大小：如果模型过大，可以尝试减少模型的大小，例如通过减少通道数或层数来减小模型的参数量。
使用更大的显存：如果可行，可以尝试在具有更大显存容量的GPU上运行代码。我更换了一个每小时2元的实例就跑通了
使用混合精度训练：通过使用混合精度训练（mixed precision training），可以减少显存的使用量。PyTorch提供了AMP（Automatic Mixed Precision）工具，可以自动执行混合精度训练。

需要根据具体情况选择适合的解决方法。如果显存不足，减少批量大小是最常见的解决方案。

关注

专栏目录