深度学习环境搭建,显卡驱动,cuda,cudnn,pytorch,装环境不求人

        由于楼主在一些意外的情况下,彻底转行做深度学习了,而且做了几年了,一直在学习,也想总结一些经验写出来,然而总是累的瘫倒在地,爬不起来写。今天从最初开始写吧,如何搭环境。想到哪写到哪。

        首先,跑深度学习,要求电脑性能非常高,反正我是用公司电脑的,用的最低档的显卡也是1080,公司最高配是rtx titan,还是不错的。内存,建议16G起步,最好是32G及以上。系统,不是一定要ubuntu等linux系统,但是深度学习这个东西,说实话,除非很有实力的公司,也没有几家有能力自己完全开发,所以github下载开源代码是常见,至少我经常就是下载然后修改,然后使用。然后很多开源代码只支持linux环境,但是不代表windows不能用,反正我这边刻意保留几台win系统电脑,也能用于训练,不过还是建议优先ubuntu吧。最近想试试deepin。

        说完配置之后就是环境搭建,这个网上一搜一大堆,我就稍微说点和其他人不一样的地方的,就装显卡驱动,目前主流还是使用Nvidia显卡,A卡不是不可以,反正我没试过,疫情期间,我老板闲着自己试过,说可以跑大多数网络,很香。嗯,很好,你自己玩儿谢谢,我喜欢那个2W的卡,高大上。

        驱动的安装,这里面有个坑是,双显卡的电脑,比如既有核显又有独显的,然后网上各种说要先禁用开源驱动什么的,转到代码模式,再安装,再怎么怎么的。其实不用这么麻烦,这里提供两种方法,我这里是基于Ubuntu18.04的,16.04似乎也是一样的。 

        第一个,直接利用系统工具,也就是“软件和更新”,里面有个附加驱动选项,里面点击安装,方便又省事,不过我也经历过点击不动的情况。其实这里我更推荐第二种方法。

        第二个,直接安装cuda,我们知道cuda安装有两种包,一个.run一个.deb,一直以来我都是严格按照网上说的,用.run,一步一步来,但是其中很多参数,很多帖子没说全,最后安装完了重启,发现黑屏了。真的是何必那么麻烦,直接通过deb包,一次性,驱动带cuda一起搞定,而且deb包安起来方便太多了。

对,就是这个,还贴心的给出来安装命令,唯一需要修改的,就是第2步的version,这个怎么写呢,仔细看看,这个是个本地路径,一步一步的tab补全出来不就好了。

建议使用这个方法的,就不要先去装驱动了,因为这个方法装驱动是强制的,还会卸载之前安装的,不过我这个教你怎么装完整环境,反正你也是要装cuda的,就一起呗。而且这个也不会装重复,顶多就是浪费前面装驱动的时间,而且安全有效。

顺便一提,已经装了cuda的怎么办。这个装的驱动不会共存,但是cuda是可以共存的(似乎是)。

我们知道,cuda的默认安装位置是:/usr/local/下,此时会有一个cuda-10.1之类的带版本的后缀,我们一般使用是,做一个给链接到当前目录,有的时候这一步是默认做好的,没有的话我们自己做,不会的自己补习shell和linux

ln -s cuda-10.1 cuda

然后在bashrc里面添加路径,这里偷懒给截图了,不过其实想想,要是能都懂,就不用看我这个了。

这样设置的话,cuda这个路径就只是一个链接,如果你需要多个版本共存,用的就是这个方法,把你需要的版本链接过去就可以了。如果想要多版本,怎么卸载不要的版本呢,可以查看cuda目录下的bin目录,是不是有一个uninstall之类的文件,执行过后就自己卸载了,但是我用的最近几个版本都没有这个功能,怎么办

sudo apt --purge remove cuda*

对,apt卸载,--purge是一个参数,不要也可以的,我也不知道为什么要,当初是查说彻底完美无残留卸载软件的版本是这样的,这里说来话长,反正就是ubuntu卸载软件,卸了后还会有一些依赖文件残留之类的,反正就这么招吧,感兴趣自己查查。 此时如果弹出有多个版本提示卸载,你可以输入N嘛,然后命令cuda后面的*改为相应的内容就行了,反正我没试过,自己折腾吧。    

        驱动和cuda安装好后,还需要cudnn,这里不多说了,现在似乎也有deb版本的包了,不过我没试过,建议还是下载压缩包,还是自己拷贝更放心。

        剩下的关键是,cuda和cudnn该使用什么版本,最新的肯定不行了,我这边主要用pytorch,而pytorch的要求其实很简单,就在pytorch官网上

这里可以看到pytorch1.4版本支持cuda9.2和10.1,还把安装命令给出来了,下载方式也有conda和pip,系统也有windows。如果你需要旧版本的pytorch怎么办,cuda对应版本自己查吧,其实很好查,官网这个页面,耐心点,往下翻,有一些说明什么的,包括前面没有给出的cuda的网址什么的,这里都有,写的挺多的,我自己懒得看了。

安装pytorch,就是通过

pip install torch==1.0

把版本号写在后面就可以了,下载好了后,进入ipython

import torch

torch.version.cuda
torch.cuda.is_available()

这两个,前一个可以查看对应的cuda版本,后一个可以查看cuda是否可用。

至于cudnn的版本,下载的时候,有提示,按照对应的cuda的版本就可以了,建议不要装最新的,次新的比较好。主要是当初装tensorflow的时候,搞了半天,有cudnn不对应的情况。

        最后一点,如果要重装cuda,但是不想重装驱动怎么办,首先,你下载cuda的时候,不能分离驱动,只下载cuda,所以下载时长是一样的,然后安装上,傻瓜式的,所以重装一下驱动有什么问题呢。

        然后就是,我比较喜欢用vscode,我的大神同事,喜欢gvim,个人不太喜欢pycharm,因为很卡,开启的时候很卡,不过我不喜欢的主要原因是,我有些同事,非常依赖这个。我使用IDE主要是编辑方便美观,他的功能其实很少用,执行也一般是在终端执行,但是我发现有些同事,没有了IDE之后,就什么都不会了,文件在哪不知道,怎么执行不知道,环境怎么配不知道,全都是pycharm给搞定。所以方便是方便,但是你自己要知道是怎么回事啊,因此我非常排斥这个软件,一种心理因素吧,不喜欢的原因是因为太方便,他也是醉了。

 

        自己总结一下吧,这篇,主要是吐槽很多网上的帖子,千篇一律,很多都是比较老的方法,不方便且不必要,建议小伙伴们用的时候可以多思考,适当走走弯路,也许此路不弯,只是走的人少而已呢。

end!

  • 0
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值