关键词:深度学习、linux服务器、计算机视觉
目录
前言
本文主要用来记录一些我常用到的linux服务器的指令,便于记忆深化。它会不断进行更新和补充。
一、查看版本和配置
1.查看cuda版本
//查看当前cuda版本:
cat /usr/local/cuda/version.txt
//查看显卡版本信息:
nvcc -V
//进入cuda目录并查看:
1.进入目录:cd /usr/local
2.查看所有版本:ls
3.查看当前使用的版本:stat cuda
2.查看conda信息
//查看conda版本:
conda --version
//查看conda信息:
1.conda info
2.conda list
//更新conda:
conda update conda
//查看所有镜像:
conda config --show channels
//添加镜像:
conda config --add channels <URLS>
ps:<URLS>替换为需要添加的网址
//查看所有虚拟环境:
conda info --envs
3.查看服务器配置
//查看Ubuntu配置:
cat /proc/version
二、linux系统目录指令
//进入某项目录:
cd XXX
//返回至上一级:
cd ../
//返回至根目录:
cd ~
//创建文件夹
mkdir XXX
三、python环境的配置
//创建虚拟环境:
conda create -n XXX python=XXX
eg:创建一个叫做py37的环境,其中python版本为3.7:
conda create -n py37 python=3.7
//激活虚拟环境:
conda activate py37
//退出虚拟环境:
conda deactivate
//使用pip命令安装txt文件里的配置包:
pip3 install -r requirements.txt
//解决安装时timeout报错:
pip --default-timeout=1000 install XXX
eg: pip --default-timeout=1000 install numpy
//使用conda命令安装或卸载包:
conda install XXX
conda uninstall XXX
四、demo运行
1.服务器挂起
使用screen工具创建窗口,在该窗口里挂起程序运行,则该程序不会因为断网或者电脑关机而终止程序的运行,是一种后台服务。
//使用前请先确认安装screen:
apt-get install screen
//新建一个叫做s1的工作窗口
screen -S s1
//查看当前所有的运行窗口
screen -ls
//将s1窗口离线
screen -d s1
//接入窗口s1
screen -r s1
//退出当前窗口,回到主界面
ctrl+A+D
//删除s1这个窗口
1.screen -X -S s1 quit
2.screen kill s1
2.控制进程
在程序运行时,监控GPU的使用状态,若温度过高或GPU被无关进程恶意占用,应该注意终止程序。
//查看显卡状态:
nvidia-smi
//使用watch命令进行实时监控:
watch -n 1 nvidia-smi
//使用stat命令简洁的显示
gpustat
//实时监控:
watch --color gpustat --color
//停止某项指令:
按ctrl-C
//挂起某项指令(暂停)
1.按ctrl-Z
2.fg再回车可恢复
//查看服务器近期所有进程,可以找到进程的id
ps aux
//强制结束进程
kill -9 进程的id
3.参数设置
在运行某些CVdemo时,会遇到需要替换参数的命令:
//下面举个例子:
1.训练:
python train.py --config-file ${CONFIG} --num-gpus ${NUM_GPUS} --resume
2.测试:
python train.py --eval-only --config-file ${CONFIG} MODEL.WEIGHTS ${SNAPSHOT}
解释:
${CONFIG} 应替换为 configs 文件夹中配置文件的路径(通常为 configs/MIAOD.py)(*.yaml)
${SNAPSHOT}应替换为训练后 work_dirs 文件夹中的检查点文件 (*.pth) 的路径
${NUM_GPUS} 替换为使用的GPU个数
总结
以上是一些常见的linux服务器指令,内容将持续更新......