提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
一、安装显卡驱动
我的显卡是gtx1660super,我首先看了一些博主的教程,发现有点复杂,需要去官网下载相关驱动,然后禁用集显,然后再用一些命令行安装,比较麻烦,然而现在ubuntu的软件安装与更新可以自动安装显卡驱动了。
等安装好后直接重启即可。
二、安装conda
1.进入CUDA官网复制所需版本的安装命令
访问CUDA官网,选择你需要下载的CUDA版本,我选择的是CUDA11.3.0
官方下载链接:https://developer.nvidia.com/cuda-downloads。
CUDA大版本与显卡驱动里面的CUDA Version的大版本相同即可,小版本不影响
https://developer.nvidia.com/cuda-11.3.0-download-archive
然后选好对应的系统配置后下载run版本的,复制官方给出的Installation Instructions:的指令到终端中运行:
wget https://developer.download.nvidia.com/compute/cuda/11.3.0/local_installers/
cuda_11.3.0_465.19.01_linux.runsudo sh cuda_11.3.0_465.19.01_linux.run
安装过程中,首先输入accept,取消勾选Driver(已经安装了驱动),选择Install,回车
在这里插入图片描述
我们在第二步已安装显卡驱动Driver,由此Driver不选,只需要把cuda tool勾选即可
2.当执行cuda_11.3.0_465.19.01_linux.runsudo sh cuda_11.3.0_465.19.01_linux.run时会出现gcc报错
这是由于gcc版本不匹配的问题
2.2.2解决方法二
变更gcc版本
2.2.2.1 CUDA11.0
可能你的gcc版本太高,变更gcc版本为9
sudo apt install gcc-9 g++-9
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 70 --slave /usr/bin/g++ g++ /usr/bin/g++-11
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-9 100 --slave /usr/bin/g++ g++ /usr/bin/g++-9
# 10,20这些表示的是优先级,可根据需要选定,优先级高的即为默认的。
切换gcc版本,这里输入2,选择gcc-9
sudo update-alternatives --config gcc
查看更改结果
gcc --version
3.配置环境变量
在.bashrc内把cuda的目录加入到PATH中,否则的话系统找不到CUDA
sudo gedit ~/.bashrc
在文件末尾加上(注意更改cuda版本为你安装的版本号,这里是cuda-11.0)
注意:这个三行的路经千万不要用,因为我的电脑装了ros2,再运行ros2时会出现兼容性问题报错
rcl_action.so: cannot open shared object file: No such file or directory
export CUDA_HOME=/usr/local/cuda-11.0
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}
所以要用下面这个,把11.0改为自己下载的版本号:
export PATH=/usr/local/cuda-11.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64:$LD_LIBRARY_PATH
运行.bashrc文件
$source ~/.bashrc
4.测试是否安装成功
终端输入
nvcc -V
出现下列页面,,显示的cuda版本正是所安装版本,说明CUDA安装成功
四、安装cuDNN
1.下载cuDNN
cuDNN官网cuDNN Archive | NVIDIA Developer
进cudnn官网下载前需要先登录,然后选择与CUDA版本对应的版本下载。
这里我一直进不去官网,ubuntu又不知道怎么挂梯子,所以先在windows系统挂梯子下载好文件然后传到ubuntu上
2.解压文件
首先cd进入下载的文件夹,我的下载到Downloads文件夹下
cd Downloads
使用tar工具解压,tar是tape archive的全称,它预装在Linux系统中。 xz是一个基于LZMA算法的文件压缩算法,使用xz算法压缩的文件通常以.tar.xz或.txz结尾。
解压tar.xz文件,可以使用tar命令带上-x(–extract)选项并用-f指定压缩文件名,
tar -xf后面加的是刚才下载好的cudd的压缩文件名
tar -xf cudnn-Linux-x86_64-8.9.5.30.tar.xz
3.复制文件
将解压出的cuda目录下的inlcude内的头文件以及lib内的链接库全部复制到/usr/local/cuda的对应文件夹下:(注意自己的目录名,有的文件夹名是lib,有的是lib64)
sudo cp cuda/lib64/* /usr/local/cuda-11.0/lib64/
sudo cp cuda/include/* /usr/local/cuda-11.0/include/
至此,GPU驱动、CUDA、cudnn就都安装好了。
五. 安装anaconda
Anaconda是一种软件包管理,它为编程语言Python和R提供图形导航,支持数据科学、数据分析和机器学习。
Anaconda让您不必担心有时遇到复杂的依赖关系问题。此外,Anaconda有一个名为Conda的包管理器,它可以使分发中的所有包保持最新。它促进了库和开发环境的安装和管理,支持在Python和R下进行数据分析和机器学习。总的来说,有许多软件包可用,包括Jupyter Notebook、Spyder、NumPy和TensorFlow。
Anaconda可用于Microsoft Windows、macOS和Linux的个人、商业、团队和企业版本。个人版是开源软件,作为免费软件免费,因此,例如,私人用户可以学习如何处理数据分析。付费版商业版、团队版和企业版为商业使用和公司使用提供了广泛的功能。
1.下载anaconda安装程序,可以anaconda官网或在清华大学开源软件镜像站下载anaconda。
2.运行安装程序
执行bash命令,bash后面是下载好的anaconda文件名
bash Anaconda3-2023.03-1-linux-x86-64.sh
然后一直按回车,yes同意隐私条款
3.配置环境
在 ~/.bashrc 末尾添加:
export PATH="~/anaconda3/bin":$PATH
source ~/anaconda3/bin/activate
后执行:
source ~/.bashrc
完成后,进入Anaconda的默认base编程环境中
接下来就可以和windows下一样,使用conda指令创建环境,安装包 了
最后测试anaconda是否成功:
conda list
如果出现很多包名,就说明可以了。
六、安装pycharm
可以直接在Ubuntu Software中搜索pycharm并安装
七/创建conda虚拟环境
1.创建虚拟环境my_env
使用annaconda的conda命令创建虚拟环境,我的环境My_torch
conda create -n <环境名称自定义> python=<python的版本号>
例如:conda create -n My_torch python=3.8 输入后回车
完成后显示done,这样我们就创建好啦:接下来
source activate <你的虚拟环境>
成功后可以看到你的环境从base变成了My_torch
2.打开火狐浏览器里输入pytorch官网用来获取下载指令
【Pytorch官网】https://pytorch.org/
由于我的conda版本是11.3,所以到previous过去版本中选择conda版本,选择版本,下面得到安装指令
CUDA 11.3
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
在我的my_env环境中进行安装:
如图,总是报错httperror,说明是网络问题。没办法
原文用官网能装上但我装不上,在验证阶段一直返回false。
解决办法:去清华大学镜像站下载 链接:清华镜像
https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/
然后根据conda install pytorch1.12.1 torchvision0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
这里面的版本去一个个查询对应的版本的文件再下载
3.无法直接用网络安装pytorch,下载镜像文件到目录,在虚拟环境中离线安装
source activate Deeplearning \激活你创建的虚拟环境
conda install --offline pytorch-2.1.1-py3.11_cuda12.1_cudnn8.9.2_0.tar.bz2
conda install --offline torchaudio-2.1.1-py311_cu121.tar.bz2
conda install --offline torchvision-0.16.1-py311_cu121.tar.bz2
4.测试是否安装成功
最后验证:
source activate Deeplearning \\激活你创建的虚拟环境
python \\运行python (启动命令与你上文中起的别名有关)
import torch \\导入torch模块,这里应该没有任何输出
torch.cuda.is_available() \\输出True则安装成功
exit() \\退出python
conda deactivate Deeplearning \\退出虚拟环境
很不幸,又又又报错了:当我import torch时,报错:
忘记了,反正找了一堆教程都不行,实在没辙,我感觉可能是之前的一个疏忽导致的:
就是我使用conda create创建一个新的虚拟环境时,终端的前缀是(base),也就是说我把新的虚拟环境创建在了base虚拟环境的路径中了,导致无法检索到,所以我干脆使用conda deactivate删除了这个环境,新建了一个zyl_torch环境,这次我特地先cd ~/,没在base里创建,然后使用offline离线安装那三个安装包
但是,依然报错,no moudle name torch,我福了。
没想到峰回路转,我直接用官方命令:
conda install pytorch1.12.1 torchvision0.13.1 torchaudio==0.12.1 cudatoolkit=11.3 -c pytorch
居然这次网络正常了,下载后 import torch 没有报错了。
然饿,当我 torch.cuda.is_available() 时,又又又又报错了,返回了false。
最后发现,conda install pytorch1.12.1 torchvision0.13.1 torchaudio0.12.1 cudatoolkit=11.3 -c pytorch这个指令不好用,我又回退了一个版本,再次创建了一个新的虚拟环境mytest,
conda install pytorch1.11.0 torchvision0.12.0 torchaudio0.11.0 cudatoolkit=11.3 -c pytorch
这个版本安装之后,就返回ture了。
注意一个重要问题:
①如果不用国内源,就要开梯子代理来下载
②如果添加了国内源:
channels:
- defaults
show_channel_urls: true
default_channels:
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
custom_channels:
conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
msys2: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
bioconda: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
menpo: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
simpleitk: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
就需要先关闭梯子,不然会一直卡住。
八/ 下载yolov5代码,用pycharm打开
1.下载代码
去这个网站clone代码:https://github.com/ultralytics/yolov5
解压后在pycharm中打开。选择解释器的环境为创建的虚拟环境zyl_torch
然后安装requirements.txt
这里我先直接下载
pip install -r requirements.txt
到一半网络超时了,所以用清华园下载
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
2.下载权重
ubuntu的网很差,下载不了,我用QQ远程传文件下载的yolov5s.pt