实验室的linux服务器有多人使用,因此无法升级显卡驱动,并且cuda只有10.1(没安装cudnn)。
最近在跑一个程序,调用cuda了,但是pytorch训练的很慢(之前用过tensorflow环境有加速效果)。仔细查看发现pytorch1.7.1对于cuda10.1版本,其对应的cudnn为7.6.3.
正常的操作是 conda install cudatoolkit==10.1 cudnn=7.6.3
然而公开的conda库包里10.1的cuda版本并没有7.6.3版本的。
这里是在stackoverflow 上搜到的解决方案,就是将cudnn文件复制到conda环境的依赖下
This is how i installed cudnn.
-
You can download cudnn tar file of a version which you want from NVIDIA and extract it. Then, you can see “cuda” folder including cudnn files.
-
Copy and paste the cudnn files to conda envs lib and include folder:
sudo cp cuda/include/cudnn*.h anaconda3/envs/“your_env_name”/include
sudo cp cuda/lib64/libcudnn* anaconda3/envs/“your_env_name”/lib
anaconda3 is your anaconda installation folder.
In my case, it worked.
然而对我来说没啥用,可能是训练代码出现了问题。