机器学习环境配置(Tesla K80安装PyTorch的全过程)

博主在Ubuntu上更新并安装Anaconda,随后尝试安装CUDA和PyTorch。过程中遇到gcc版本不兼容问题,先后尝试安装不同版本的CUDA和GCC,最终成功安装CUDA 11.1和配置环境变量。由于NVIDIA驱动问题,还涉及到了屏蔽Nouveau和安装Linux Nvidia显卡驱动。最后成功创建conda环境并准备安装PyTorch。
摘要由CSDN通过智能技术生成

"""Waring:多图预警"""

 本以为update&upgrade要花上大半天,ali云真的快

先查看一下Ubuntu默认的Python版本 

反正要装Anaconda的是不是不用管这个啊

sudo reboot

然后访问Anaconda官网,下载

 再SFTP传过去

sudo bash Anaconda3-2021.05-Linux-x86_64.sh

 持续enter

Do you accept the license terms?

yes

 继续enter,使用默认安装位置

等待安装............

 

 

它推荐了PyCharm,那一会儿就试试pycharm远程开发吧

 接下来打nv驱动

Cuda Toolkit,pytorch要互相兼容

由于显卡比较老,经学长建议我决定安装历史版本Pytorch1.5.1,此版本Pytorch支持的最高Cuda版本为10.2

wget https://developer.download.nvidia.com/compute/cuda/10.2/Prod/local_installers/cuda_10.2.89_440.33.01_linux.run
sudo sh cuda_10.2.89_440.33.01_linux.run

 

 遇到报错“Failed to verify gcc version. See log at /var/log/cuda-installer.log for details.”

由此nv官网找到此CUDA ToolKit对应gcc版本:::

(没写20.04支持啥版本啊不会以后还得回滚Ubuntu18吧。。。

那就装个最新的试试(god bless me

sudo reboot

不知道哪个Ubuntu版本开始有[A start job is running for Wait for Network to be configured]

先处理掉这个问题

sudo nano /lib/systemd/system/systemd-networkd-wait-online.service

[service]下加

TimeoutStartSec=2sec

(方法源Ubuntu18.4 开机卡“A start job is running for wait for network to be Configured”的解决方法_baidu_19452317的博客-CSDN博客

继续安装cuda toolkit

sudo sh cuda_10.2.89_440.33.01_linux.run

 不行啊真得旧GCC

 接下来想办法安装GCC7.3.0

 

整不会了

回去装Cuda11.1去

下载

 enter

不行啊出错了,那我还原之前的办法先打一个driver

懂了没屏蔽Nouveau

干掉Nouveau安装Linux Nvidia显卡驱动_chengde6896383的专栏-CSDN博客_nouveau

 (再试一下直接装CudaToolkit

不行,装驱动吧

(使用sudo apt --fix-broken install好像把gcc7补全了,再试试cuda10.2(不行啊gcc7还是不能用

sudo sh NVIDIA-Linux-x86_64-470.57.02.run :success(忘截图了

接下来是11.1的CudaToolKit

好漫长...

好折磨......

YEAH!

设置环境变量

alice@foundation:~$ sudo nano /etc/ld.so.conf
alice@foundation:~$ sudo ldconfig
alice@foundation:~$ export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.1/lib64
alice@foundation:~$ export PATH=$PATH:/usr/local/cuda-11.1/bin
alice@foundation:~$ export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-11.1

 Cuda Toolkit安装到此结束

cudnn日后再说

接下来安装Pytorch

使用conda命令新建环境

我Anaconda呢???

离谱啊我又开始重装了

((啊没配置环境变量QWQ

(((安装的时候用sudo给我默认安装到root文件夹下了

重装回home

配置环境变量:Linux下安装Anaconda3详细教程_奈斯菟咪踢呦-CSDN博客_linux安装anaconda3的步骤

 conda新建环境:conda创建python环境 - 简书

alice@foundation:~$ conda create -n pytorch
Collecting package metadata (current_repodata.json): done
Solving environment: done


==> WARNING: A newer version of conda exists. <==
  current version: 4.10.1
  latest version: 4.10.3

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /home/alice/anaconda3/envs/pytorch



Proceed ([y]/n)? y

Preparing transaction: done
Verifying transaction: done
Executing transaction: done
#
# To activate this environment, use
#
#     $ conda activate pytorch
#
# To deactivate an active environment, use
#
#     $ conda deactivate
alice@foundation:~$ conda activate pytorch
(pytorch) alice@foundation:~$

conda换源:conda换源 - 知乎

Pytorch官网:Start Locally | PyTorch

NOTE: 'nvidia' channel is required for cudatoolkit 11.1
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia

SSH上的screen还没部署,用KVM跑吧明早看结果

Good Night 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值