查看GPU/CPU 信息:
cat /proc/driver/nvidia/gpus/000000\:1e.0/information #查看gpu信息
nvidia-smi #查看一次
watch -n 1 nvidia-smi #实时查看,1秒刷新1次
pip install gpustat
watch --color -n1 gpustat -cpu #动态实时监控GPU的使用情况
nvidia-smi -L #list all available NVIDIA devices
sudo fuser -v /dev/nvidia* #查找占用GPU资源的PID
sudo kill -9 ***(PID) #解除显存占用
lspci | grep -i vga #查看显卡信息
lspci | grep -i nvidia #查看nvidia显卡信息
lspci | egrep ‘VGA|3D’ #显示所有显卡信息
free -m #单独查看内存使用情况
top #查看内存和cpu使用请况
cat /proc/cpuinfo #查看cpu信息
Docker 镜像挂载GPU:
export DEVICES=$(\ls /dev/nvidia* | xargs -I{} echo ‘–device {}:{}’)
docker run --gpus all $DEVICES -ti --rm --net=host --name gpu-docker-env \
--cap-add=SYS_PTRACE --cap-add=SYS_NICE --security-opt seccomp=unconfined \
-e TERM=xterm-256color -e COLUMNS="tput cols
" -e LINES="tput lines
" \
-v /home:/home \
-w /home \
-v /data:/data/ \
-v /data/code/ml-platform \
hub.mobvista.com/ml-platform/ml-platform-thirdparty-build-gpu:0.2 bash