断电后重启实验室的GPU服务器,然后设置开机自启动SSH远程访问服务时,一直报错。
于是怀疑是 /etc/ssh/sshd_config文件里没有把一些东西的注释删掉,于是做了以下操作:
(1)查看服务器是否安装SSH
-bash-4.2# rpm -qa | grep ssh
openssh-keycat-7.4p1-11.el7.x86_64
fence-agents-ilo-ssh-4.0.11-66.el7.x86_64
libssh2-1.4.3-10.el7_2.1.x86_64
openssh-clients-7.4p1-11.el7.x86_64
openssh-askpass-7.4p1-11.el7.x86_64
ksshaskpass-0.5.3-7.el7.x86_64
openssh-7.4p1-11.el7.x86_64
openssh-server-7.4p1-11.el7.x86_64
根据上述命令发现Centos7默认安装了SSH包。
(2)查看配置文件里是否开启了服务
-bash-4.2# vim /etc/ssh/sshd_config
结果如下所示:配置文件没有问题
注:这里解释一些配置文件里的一些内容注释
#禁用root账户登录,如果是用root用户登录请开启
PermitRootLogin yes
# 是否让 sshd 去检查用户家目录或相关档案的权限数据,
# 这是为了担心使用者将某些重要档案的权限设错,可能会导致一些问题所致。
# 例如使用者的 ~.ssh/ 权限设错时,某些特殊情况下会不许用户登入
StrictModes no
# 是否允许用户自行使用成对的密钥系统进行登入行为,仅针对 version 2。
# 至于自制的公钥数据就放置于用户家目录下的 .ssh/authorized_keys 内
RSAAuthentication yes
PubkeyAuthentication yes
AuthorizedKeysFile .ssh/authorized_keys
# 有了证书登录了,就禁用密码登录吧,安全要紧
PasswordAuthentication no
(3)重启OpenSSH服务
-bash-4.2#service sshd restart
Error getting authority :Error initializingauthority: Could not connect: No such file ordirectory (g-io-error-quark,1)
出现问题了:获取权限出错∶错误的初始化权限,无法连接,没这样的文件或目录( g-io-error-quark,1 )
(4)看看日志
-bash-4.2# journalctl -xb
这时候想起了日志是个好东西,它里面记录了报错的原因,于是就上述命令查看日志发现,出现了如下图所示的报错:
将该报错信息输入到百度检索发现,原来好多人都遇到过类似的事情。于是我们终于查找到了原因——原来是一起负责维护的同学之前做磁盘挂载的时候,/home/data重新挂载到了sdc1磁盘,由于/etc/fstab 中用的是之前的文件类型xfs ,想着说为了后续扩容,就进行了格式化,然后用了新的类型ext4,导致启动系铳时,没办法加载到。
于是为了解决该问题,就先把之前的挂载卸载掉了
# 卸载:umount 设备名称 或者 挂载目录
-bash-4.2#unmount /home/data
然后用lsblk -f查看sdc已经没有挂载任何东西了
(5)删除对应的磁盘挂载配置信息
-bash-4.2#vim /etc/fstab
(6)重启服务器
(7)用MaboXterm连接一下GPU服务器,成功
--------------------------------------------------------------------------------------------------------------------------------------------
注:在进行第(4)步之前执行了内核的升级(由于这步神操作导致了后面的NVIDIA不能用!!!!!!!!!!!!!具体详见下一篇博客)
因此,不要轻易升级内核!!!!!!!!!!!会带来连锁反应的!!!!!!!!!!!!!!!!!
-bash-4.2# nvidia-smi
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.