由于遇到了不能使用两块 k80GPU,
和pycharm 远程连接服务器的时候不能调试的问题:
ImportError: dlopen: cannot load any more object with static TLS
然后 conda install 的 pytorch 使用的 cudnn 版本的6的,使用
torch.backends.cudnn.version()
来查看使用的 cunn版本。
详细参见我提的 issue cudnn version found error, v7 files but got v5.1.10 #3896.
所以需要从源码编译中安装,然后遇到一堆坑。
1. 编译的时候cudnn版本不对
使用的 cuda 8.0, 在编译的时候提示
note: #pragma message: CuDNN v5 found, but need at least CuDNN v6.
在 log中找到
-- Found cuDNN: v5.1.10 (include: /usr/local/cuda-8.0/include, library: /usr/lib/x86_64-lin