ssh的作用
有很多应用需要打通ssh互信,我这里主要是为了调度mpich。
ssh的原理可以参见 [ 阮一峰 SSH互信的原理与应用]
在实际打通的过程中也遇到了一些问题。我这里将相关的问题整理如下,以供后续参考。
假设链接的机器是MA,MB。
我们先按照配置MA访问MB的形式进行配置。MB访问MA的配置也相同。
机器互连 (MA+MB都要操作)
- 修改 /etc/hosts,ip 域名映射,格式:[ip 域名]
- 修改 /etc/hosts.allow 添加准许访问的ip信息,格式:[sshd:地域1 地域2 地域3]
公钥登录配置
- 【MA+MB】生成钥匙对
- ssh-keygen -t rsa
- 【MA+MB】添加公钥
-
- 拷贝【MA+MB】到文件 authorized_keys
-
- 拷贝 authorized_keys 到 【MA + MB】 ~/.ssh/authorized_keys 中
更改文件权限(公钥信息要对其他人拥护保密)
chmod 755 ~/.ssh/
chmod 600 ~/.ssh/id_rsa ~/.ssh/id_rsa.pub ~/.ssh/id_rsa/authorized_keys
chmod 644 ~/.ssh/known_hosts
-rw——-. 1 advert advert 790 1月 24 16:09 authorized_keys
-rw——-. 1 advert advert 1679 1月 24 11:31 id_rsa
-rw——-. 1 advert advert 395 1月 24 11:31 id_rsa.pub
可能出现的问题
基本上,完成上面之后都可以登录了。
如果还出现其他问题,一般可以参考:
- port 获取或者更改
问题以及改进:
- etc/ssh_config查找、或者修改port,如果,修改,进行重启
MPI 链接
mpi链接得时候,需要制定端口号,默认都是22,当机器的链接端口号不一致的时候,无法跨集群执行。
解决方法,更改:~/.ssh/config
格式如下:
Host mpitrain_1
Port 5101
Host mpitrain_2
Port 5102
debug方法
有与一台机器的host配置重复,debug了很久无法发现。后来op使用了一种debug方法,很有小:
MA ssh 登录 MB 问题检测。
MA: ssh -v 显示的查看链接过程以及配置的正确加载。(如果有链接的过程,继续查看)
MB:tail -f /var/log/secure: 链接过程中同步打开。
host被配置重复的就是被第二个方法检测出来的链接的域名ip不对称。