常用linux指令:
切root:Sudo su
创建新用户:adduser cjl
分享conda环境:cp .bashrc /home/wcf/.bashrc
改变普通登陆用户:su cjl
释放文件读写权限:chmod -R 777 name
常用conda指令:
切root:Sudo su
创建新用户:adduser cjl
分享conda环境:cp .bashrc /home/wcf/.bashrc
改变普通登陆用户:su cjl
释放文件读写权限:chmod -R 777 name
常用GPU调度指令:
显示显卡状态:watch -n 5 nvidia-smi
清空显存:sudo fuser -v /dev/nvidia* |awk '{for(i=1;i<=NF;i++)print "kill -9 " $i;}' | sudo sh
后台运行:nohup python my.py >> /usr/local/python/xxf/my.log 2>&1 &
查看所有后台进程:ps -ef
关闭进程;kill -9 进程号
安装GPU驱动:
1.删除原有NVIDIA驱动
sudo apt-get remove --purge nvidia*
2.禁用nouveau
sudo vim /etc/modprobe.d/blacklist.conf
在最后一行添加
blacklist nouneau
执行
sudo update-initramfs -u
3.重启
lsmod | grep nouveau # 没输出代表禁用生效,要在重启之后执行
4.从NVIDIA显卡驱动下载对应的显卡驱动
选择最新的版本获得.run文件
5.安装
sudo chmod a+x NVIDIA-Linux-x86_64-418.43.run
sudo sh NVIDIA-*.run --no-opengl-files --no-x-check --no-nouveau-check
- –no-opengl-files 只安装驱动文件,不安装OpenGL文件。这个参数最重要
- –no-x-check 安装驱动时不检查X服务
- –no-nouveau-check 安装驱动时不检查nouveau
安装过程中的可以按默认设置点击
6.检验是否安装成功,命令nvidia-smi
安装miniconda:
1、下载安装包:wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
给予运行权限:chmod 777 Miniconda3-latest-Linux-x86_64.sh
运行安装:sh Miniconda3-latest-Linux-x86_64.sh
2、这个不做应该也行,自动添加了:vim .bashrc 在尾部添加 export PATH="/mnt/inspurfs/user-fs/tuguoqing/miniconda3/bin:"$PATH
创建虚拟环境 conda create -n [环境名] python=3.6
配置conda源
安装cuda:
建议按顺序装一遍
1、# 系统升级
sudo apt-get update -y
sudo apt-get upgrade -y
# 安装python基础开发包
sudo apt install -y python-dev python-pip python-nose gcc g++ git gfortran vim build-essential
2、#安装运算加速库
sudo apt install -y libopenblas-dev liblapack-dev libatlas-base-dev
3、官网下载cuda:https://developer.nvidia.com/cuda-downloads ,选择runfile(local)类型文件安装
我选了11.6
4、chmod 777 cuda_11.0.3_450.51.06_linux.run # 修改权限
sudo ./cuda_11.0.3_450.51.06_linux.run # 运行安装
不要安装OpenGL。这里建议驱动和cuda分开装,这里不用再装驱动,文档也没必要,毕竟有在线文档
5、 显示了安装路径及log,需要确保的路径配置。
将CUDA路径添加至环境变量,在终端输入sudo vim ~/.bashrc
末尾添加后再source ~/.bashrc即可
# cuda path
# ln -s /usr/local/cuda-11.0 /usr/local/cuda #建立软链接
export CUDA_HOME=/usr/local/cuda
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
测试安装完成:nvcc -V
安装cudnn,cuda安装成功可直接使用conda install cudnn下载最新cudnn
cudnn下载路径:cuDNN Archive | NVIDIA Developer
我选了11.3,没有和最新的cuda匹配的,没出问题
1、选动态库安装,点击下载,deb方式卸载更新起来不太方便
解压cudnn-11.0-linux-x64-v8.0.5.39.tgz
tar -xzvf cudnn-11.0-linux-x64-v8.0.5.39.tgz
2、拷贝.h 和 libs文件到cuda安装目录,并给予执行权限:
sudo cp -d cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp -d cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
zerotier组网,外网访问实验室服务器
任何一个浏览器:首先访问zerotier官网:ZeroTier – Global Area Networkinghttps://www.zerotier.com/
登陆,点击创建网络,服务器和想要外网连接服务器的任意主机pc安装zerotier就可以通过ID加入这个组网,其中,建议先在路由器上进行设置,给服务器分配固定的IP地址,以免每次重启后更换ip,zerotier组网的原理实际是根据各个主机的IP映射到一个网关下,实现在同一个内网下的效果,所以当更新IP后就要重新申请根据组网ID加入组网,这样只要在一个组网下,用户就可以在任意地方根据zerotier分配的服务器组网IP访问服务器
如下图,左边打勾即说明允许加入内网,就能根据垃圾桶图标右侧给的ip进行互相访问
部分转自:ubuntu18.04上cuda及cudnn安装_alex1801的博客-CSDN博客_ubuntu18.04安装cuda