凯哥英语视频
今天用浪潮服务器跑模型遇到一个报错
CUDA out of memory. Tried to allocate 11GiB (GPU 0; 32GiB total capacity; 18GiB already
说是显存不足
一般来说就是 batch_size 过大
最优解决方案, 直接先把batch_size改为1,然后慢慢放大
这样的话, 1可以迅速判断是否是显存问题报错, 2重拾信心啊啊啊
另外,记录一下查看显存的命令和调用运行的命令吧
别的也没啥说的
ok,那就这样吧~
欢迎各位大佬留言吐槽,也可以深入交流~