文|Seraph
00 | ssh
一、常用命令
- 以服务的形式启动ssh:
/usr/sbin/sshd -D
- 设置无密钥访问模式命令:
ssh-keygen -t rsa
ssh -p 30000 root@hvd mkdir -p .ssh
cat .ssh/id_rsa.pub | ssh -p 30000 root@hvd 'cat >> .ssh/authorized_keys'
二、文件路径:
- ssh配置文件路径:
/etc/ssh/sshd_config
01 | docker
一、常用命令
- 主机网络模式运行容器:
docker run -itd --network=host --name lspV1.0.2 40a97f5bea85 /bin/bash
- 导入压缩包(容器导出的)成镜像:
docker import horovodmpi2.tar lsp/horovodmpi:v1.0.2
02 | horovod
二、常用命令
-
运行多机环境:
mpirun --allow-run-as-root -np 4 -H hvd:2,hvd1:2 -bind-to none -map-by slot -x NCCL_DEBUG=INFO -x LD_LIBRARY_PATH -x PATH -mca pml ob1 -mca btl ^openib -mca btl_tcp_if_include eno1 -x NCCL_SOCKET_IFNAME=eno1 -mca plm_rsh_args "-p 30000" python tensorflow_mnist.py
-
运行benchmark示例:
horovodrun -np 1 -H localhost:1 python scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --model resnet101 --batch_size 64 --variable_update horovod
-
指定GPU运行:
CUDA_VISIBLE_DEVICES=0 horovodrun -np 1 -H localhost:1 python tensorflow_mnist.py
03 | pip
一、常用命令
- 覆盖安装:
pip install --ignore-installed tensorflow-gpu==1.12.0
04 zip
一、常用命令
- 压缩文件夹:
zip -q -r html.zip /home/html
env:
离开虚拟环境:deactivate