1、RuntimeError: CUDA out of memory. Tried to allocate 14.00 MiB (GPU 0; 10.76 GiB total capacity; 9.69 GiB already allocated; 15.56 MiB free; 9.91 GiB reserved in total by PyTorch)
- 应该有三个原因
- GPU还有其他进程占用显存,导致本进程无法分配到足够的显存
- 缓存过多,使用
torch.cuda.empty_cache()
清理缓存 - 卡不行,换块显存更大的卡吧
- 除此之外,注意pytorch在test时,一定要加上
下面的很有效:
with torch.no_grad():
# test process
否则会使显存加倍导致OOM错误
2、远程主机间复制文件及文件夹
复制文件:
* 命令格式:
scp local_file remote_username@remote_ip:remote_folder
或者
scp local_file remote_username@remote_ip:remote_file
或者
scp local_file remote_ip:remote_folder
或者
scp local_file remote_ip:remote_file
复制目录:
* 命令格式:
scp -r local_folder remote_username@remote_ip:remote_folder
或者
scp -r local_folder remote_ip:remote_folder