k8s常用的命令
1. 查看所有的节点
kubectl get nodes
2. 查看名为atlas的节点的详情
kubectl describe node atlas
3. 查看所有节点服务器的IP
kubectl get nodes -o wide
4. 以GB的形式查看可用内存
free -g
5. 以MB的形式查看可用内存
free -m
6. 查看所有运行中的容器
kubectl get pods -n ai-train
7. 查看get job.batch.volcano.sh的容器
kubectl get job.batch.volcano.sh -n ai-train
8. 删除job.batch.volcano.sh 下的容器
kubectl delete job.batch.volcano.sh -n ai-train trainenv-huawei-20210805142759721
单位常用命令
-
通过实例ID查找Pod
kubectl get pods -n ai-train|grep <实例id> -
进入容器(pod为running状态才能进入)
kubectl exec -it -n ai-train <实例id> /bin/bash -
容器内相关目录说明
/models 模型文件存储目录
/common 配置文件和启动脚本
/dataset 训练数据和测试数据 -
宿主机文件挂载目录说明
/csg-ai/train_job/<年>/<月>/<日>/<实例id>/common/config 配置文件和启动脚本 -
其他相关命令
查看pod详情 kubectl describe pod -n ai-train <实例id>