【集群管理】可能遇到的问题及解决方法(持续更新中......)

1.创建账号

 

首先创建账号:

useraddxxx   #xxx为用户名

passwd xxx

 

然后cdnis环境目录,执行make,同步其他节点账号

cd /var/yp

make

这时候所有计算节点都有该账户

 

实现ssh无密码登陆(若需要):

切换到xxx账户:

su xxx

ssh-keygen-t rsa #回车三次

ssh-copy-id localhost #回车输入密码即可

 

完成

 


2. 若管理节点死机


需要登录bmc ip去重启机器 


重新挂载计算节点的/opt/intel 、/opt/caffeData  /home

挂载方法见【集群管理】新集群管理节点dl1 账户创建及挂载



3. 计算节点死机或者关机

 

两种方法:


一种是到实验室重启所有机器

重启过程中有的机器一次性无法重启,需要多重启几次。尤其是1314号机器

 
另一种记录下bmc ip 远程重启


node1 上需要重新挂载/mnt/keepfs

挂载方法:

dsh -aM -c "mount -t lustre10.0.0.102@o2ib0:/keepfs /mnt/keepfs"

 

4. KNL节点root用户可以登录,但是没有普通用户

 

nis服务没启动,nis服务没启动是没有普通用户的

 

root权限登录到该节点

运行service  ypbind start启动下就可以了



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值