深度学习环境搭建，显卡驱动，cuda，cudnn，pytorch，装环境不求人

最新推荐文章于 2024-06-09 18:27:55 发布

Daniel大人

最新推荐文章于 2024-06-09 18:27:55 发布

阅读量928

点赞数

分类专栏：图像视觉文章标签： pytorch 深度学习 visual studio code

本文链接：https://blog.csdn.net/elysion_daniel/article/details/105426942

版权

图像视觉专栏收录该内容

7 篇文章 2 订阅

订阅专栏

由于楼主在一些意外的情况下，彻底转行做深度学习了，而且做了几年了，一直在学习，也想总结一些经验写出来，然而总是累的瘫倒在地，爬不起来写。今天从最初开始写吧，如何搭环境。想到哪写到哪。

首先，跑深度学习，要求电脑性能非常高，反正我是用公司电脑的，用的最低档的显卡也是1080，公司最高配是rtx titan，还是不错的。内存，建议16G起步，最好是32G及以上。系统，不是一定要ubuntu等linux系统，但是深度学习这个东西，说实话，除非很有实力的公司，也没有几家有能力自己完全开发，所以github下载开源代码是常见，至少我经常就是下载然后修改，然后使用。然后很多开源代码只支持linux环境，但是不代表windows不能用，反正我这边刻意保留几台win系统电脑，也能用于训练，不过还是建议优先ubuntu吧。最近想试试deepin。

说完配置之后就是环境搭建，这个网上一搜一大堆，我就稍微说点和其他人不一样的地方的，就装显卡驱动，目前主流还是使用Nvidia显卡，A卡不是不可以，反正我没试过，疫情期间，我老板闲着自己试过，说可以跑大多数网络，很香。嗯，很好，你自己玩儿谢谢，我喜欢那个2W的卡，高大上。

驱动的安装，这里面有个坑是，双显卡的电脑，比如既有核显又有独显的，然后网上各种说要先禁用开源驱动什么的，转到代码模式，再安装，再怎么怎么的。其实不用这么麻烦，这里提供两种方法，我这里是基于Ubuntu18.04的，16.04似乎也是一样的。

第一个，直接利用系统工具，也就是“软件和更新”，里面有个附加驱动选项，里面点击安装，方便又省事，不过我也经历过点击不动的情况。其实这里我更推荐第二种方法。

第二个，直接安装cuda，我们知道cuda安装有两种包，一个.run一个.deb，一直以来我都是严格按照网上说的，用.run，一步一步来，但是其中很多参数，很多帖子没说全，最后安装完了重启，发现黑屏了。真的是何必那么麻烦，直接通过deb包，一次性，驱动带cuda一起搞定，而且deb包安起来方便太多了。

对，就是这个，还贴心的给出来安装命令，唯一需要修改的，就是第2步的version，这个怎么写呢，仔细看看，这个是个本地路径，一步一步的tab补全出来不就好了。

建议使用这个方法的，就不要先去装驱动了，因为这个方法装驱动是强制的，还会卸载之前安装的，不过我这个教你怎么装完整环境，反正你也是要装cuda的，就一起呗。而且这个也不会装重复，顶多就是浪费前面装驱动的时间，而且安全有效。

顺便一提，已经装了cuda的怎么办。这个装的驱动不会共存，但是cuda是可以共存的（似乎是）。

我们知道，cuda的默认安装位置是：/usr/local/下，此时会有一个cuda-10.1之类的带版本的后缀，我们一般使用是，做一个给链接到当前目录，有的时候这一步是默认做好的，没有的话我们自己做，不会的自己补习shell和linux

ln -s cuda-10.1 cuda

然后在bashrc里面添加路径，这里偷懒给截图了，不过其实想想，要是能都懂，就不用看我这个了。

这样设置的话，cuda这个路径就只是一个链接，如果你需要多个版本共存，用的就是这个方法，把你需要的版本链接过去就可以了。如果想要多版本，怎么卸载不要的版本呢，可以查看cuda目录下的bin目录，是不是有一个uninstall之类的文件，执行过后就自己卸载了，但是我用的最近几个版本都没有这个功能，怎么办

sudo apt --purge remove cuda*

对，apt卸载，--purge是一个参数，不要也可以的，我也不知道为什么要，当初是查说彻底完美无残留卸载软件的版本是这样的，这里说来话长，反正就是ubuntu卸载软件，卸了后还会有一些依赖文件残留之类的，反正就这么招吧，感兴趣自己查查。此时如果弹出有多个版本提示卸载，你可以输入N嘛，然后命令cuda后面的*改为相应的内容就行了，反正我没试过，自己折腾吧。

驱动和cuda安装好后，还需要cudnn，这里不多说了，现在似乎也有deb版本的包了，不过我没试过，建议还是下载压缩包，还是自己拷贝更放心。

剩下的关键是，cuda和cudnn该使用什么版本，最新的肯定不行了，我这边主要用pytorch，而pytorch的要求其实很简单，就在pytorch官网上

这里可以看到pytorch1.4版本支持cuda9.2和10.1，还把安装命令给出来了，下载方式也有conda和pip，系统也有windows。如果你需要旧版本的pytorch怎么办，cuda对应版本自己查吧，其实很好查，官网这个页面，耐心点，往下翻，有一些说明什么的，包括前面没有给出的cuda的网址什么的，这里都有，写的挺多的，我自己懒得看了。

安装pytorch，就是通过

pip install torch==1.0

把版本号写在后面就可以了，下载好了后，进入ipython

import torch

torch.version.cuda
torch.cuda.is_available()

这两个，前一个可以查看对应的cuda版本，后一个可以查看cuda是否可用。

至于cudnn的版本，下载的时候，有提示，按照对应的cuda的版本就可以了，建议不要装最新的，次新的比较好。主要是当初装tensorflow的时候，搞了半天，有cudnn不对应的情况。

最后一点，如果要重装cuda，但是不想重装驱动怎么办，首先，你下载cuda的时候，不能分离驱动，只下载cuda，所以下载时长是一样的，然后安装上，傻瓜式的，所以重装一下驱动有什么问题呢。

然后就是，我比较喜欢用vscode，我的大神同事，喜欢gvim，个人不太喜欢pycharm，因为很卡，开启的时候很卡，不过我不喜欢的主要原因是，我有些同事，非常依赖这个。我使用IDE主要是编辑方便美观，他的功能其实很少用，执行也一般是在终端执行，但是我发现有些同事，没有了IDE之后，就什么都不会了，文件在哪不知道，怎么执行不知道，环境怎么配不知道，全都是pycharm给搞定。所以方便是方便，但是你自己要知道是怎么回事啊，因此我非常排斥这个软件，一种心理因素吧，不喜欢的原因是因为太方便，他也是醉了。

自己总结一下吧，这篇，主要是吐槽很多网上的帖子，千篇一律，很多都是比较老的方法，不方便且不必要，建议小伙伴们用的时候可以多思考，适当走走弯路，也许此路不弯，只是走的人少而已呢。

end！

Daniel大人

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
深度学习环境搭建，显卡驱动，cuda，cudnn，pytorch，装环境不求人

由于楼主在一些意外的情况下，彻底转行做深度学习了，而且做了几年了，一直在学习，也想总结一些经验写出来，然而总是累的瘫倒在地，爬不起来写。今天从最初开始写吧，如何搭环境。想到哪写到哪。首先，跑深度学习，要求电脑性能非常高，反正我是用公司电脑的，用的最低档的显卡也是1080，公司最高配是rtx titan，还是不错的。内存，建议16G起步，最好是32G及以上。系统，...
复制链接

扫一扫

专栏目录