又是一个苦逼 的 change:
今天做sshg3 (tectia 6.3.3 到 6.3.9 的升级。)
开始在uat 上测试很成功,没有SSH 进程断的情况,今天居然断了,由于是远程升级,
那才叫苦逼啊,还要去DC,申请,流程走起来。
到现场还担心没有窜口线,连不上,最后到了现场,才发现是P740 的机器,有lpar 的。需要HMC。
刚好发现有一个HMC 在server 相同的机柜。
激动了一下。 发现HMC 和server 的连接 connection 是not avaliable 的。
那怎么办呢?到了那里已近是下午3:00了。话说那天还是 早上4点就起来被电话搞起来。
1:先把server 的LED 面板拉出来。
看到 HMC=0, 确定是没有连HMC 的。
按 中间的 (确认键),这时: 有hmc=01 的界面变成:01 , 然后按右边的 向上的箭头,变成 02
好,再按 中间的 (确认键),再按一下(确认键),变成: 02 - B<N, 继续按 右边 向上的箭头,
变成: 02 - B N< ,继续按 右边的 箭头,变成 02 - B - M, 好,变成 变成M 就好了。
下面继续 按 (确认键),变成 02
好,这个02 是关键了,下面开始按左边,向下的箭头,或者右边向上的箭头,到30
到了30 以后,按中间的确认键,变成30**, 再按 (确认键)。
变成3001 按 (确认键),再 (确认键),变成有一个IP 了: 10.20.30.4 (这个就是 server 上HMC2 端口连的 IP)
按 (确认键),IP 消失,变成3001, 再按左边 向下的箭头,变成 3000
按 (确认键),变成: 192.168.2.100 (这个是 server 上HMC1 端口连的 IP)。
2: 上面把 server 上 每个HMC 端口对应的ip 找到后,下面开始要用HMC 了。
首先看一下HMC 上4个网卡的IP 设置:在第二块网卡上设置好IP: 192.168.2.101
对应后面的网口连线到 server 上,注意是 server 上的HMC 1 口。
下面开始做联通性测试了: HMC managment --> test connection ---> ping 一下,
很不幸运,ping 不通。
后来,搞来个小电脑,在本地local ip 设成192.168.2.10 可以ping 通 两个 对端 (Server HMC1 口,HMC 的第二个端口)。
那就是 HMC 和 server 的联通性有问题。
3:后来,也有个方法,就是确认这个HMC 有问题,从其他的机柜 的 HMC 拉个长的网线 想管理 这个P740 server。
还是把这个破 hmc 重启一下吧。
说来也妖,重启一下后。
开始连:
HMC 上面的 server ---> connection --> add server managment
出现 要连接的ip ,输入后,不要输入密码。 开始连。
后来还真的连上去了。
4:HMC 连上 server 以后,看一下时间: 20:00,时间从我到机房,已经过了5个小时了。
下面开始从新start ssh 进程。
先看一下有的server 没有ssh 进程就好了。
startsrc -s ssh-tectia-server
有的有报错: 说是ssh process is already started, multiple process .
这个就要求把要来剩下的ssh 没有用的 个别的给停掉,kill 掉就从新 start 就好了。
还有的server 进程就是不起来,原来是ssh 配置文件有问题。
cp ssh-server-config-default.xml ssh-server-config.xml
startsrc -s ssh-tectia-server 就好了。
5:下次吸取教训,SSH 升级一定要把telnet 给打开,不管是aix, linux, 还是 sun soalris 的机器。
等全部搞定,晚上11 点了。你说 这是不是 苦逼的周末?
今天做sshg3 (tectia 6.3.3 到 6.3.9 的升级。)
开始在uat 上测试很成功,没有SSH 进程断的情况,今天居然断了,由于是远程升级,
那才叫苦逼啊,还要去DC,申请,流程走起来。
到现场还担心没有窜口线,连不上,最后到了现场,才发现是P740 的机器,有lpar 的。需要HMC。
刚好发现有一个HMC 在server 相同的机柜。
激动了一下。 发现HMC 和server 的连接 connection 是not avaliable 的。
那怎么办呢?到了那里已近是下午3:00了。话说那天还是 早上4点就起来被电话搞起来。
1:先把server 的LED 面板拉出来。
看到 HMC=0, 确定是没有连HMC 的。
按 中间的 (确认键),这时: 有hmc=01 的界面变成:01 , 然后按右边的 向上的箭头,变成 02
好,再按 中间的 (确认键),再按一下(确认键),变成: 02 - B<N, 继续按 右边 向上的箭头,
变成: 02 - B N< ,继续按 右边的 箭头,变成 02 - B - M, 好,变成 变成M 就好了。
下面继续 按 (确认键),变成 02
好,这个02 是关键了,下面开始按左边,向下的箭头,或者右边向上的箭头,到30
到了30 以后,按中间的确认键,变成30**, 再按 (确认键)。
变成3001 按 (确认键),再 (确认键),变成有一个IP 了: 10.20.30.4 (这个就是 server 上HMC2 端口连的 IP)
按 (确认键),IP 消失,变成3001, 再按左边 向下的箭头,变成 3000
按 (确认键),变成: 192.168.2.100 (这个是 server 上HMC1 端口连的 IP)。
2: 上面把 server 上 每个HMC 端口对应的ip 找到后,下面开始要用HMC 了。
首先看一下HMC 上4个网卡的IP 设置:在第二块网卡上设置好IP: 192.168.2.101
对应后面的网口连线到 server 上,注意是 server 上的HMC 1 口。
下面开始做联通性测试了: HMC managment --> test connection ---> ping 一下,
很不幸运,ping 不通。
后来,搞来个小电脑,在本地local ip 设成192.168.2.10 可以ping 通 两个 对端 (Server HMC1 口,HMC 的第二个端口)。
那就是 HMC 和 server 的联通性有问题。
3:后来,也有个方法,就是确认这个HMC 有问题,从其他的机柜 的 HMC 拉个长的网线 想管理 这个P740 server。
还是把这个破 hmc 重启一下吧。
说来也妖,重启一下后。
开始连:
HMC 上面的 server ---> connection --> add server managment
出现 要连接的ip ,输入后,不要输入密码。 开始连。
后来还真的连上去了。
4:HMC 连上 server 以后,看一下时间: 20:00,时间从我到机房,已经过了5个小时了。
下面开始从新start ssh 进程。
先看一下有的server 没有ssh 进程就好了。
startsrc -s ssh-tectia-server
有的有报错: 说是ssh process is already started, multiple process .
这个就要求把要来剩下的ssh 没有用的 个别的给停掉,kill 掉就从新 start 就好了。
还有的server 进程就是不起来,原来是ssh 配置文件有问题。
cp ssh-server-config-default.xml ssh-server-config.xml
startsrc -s ssh-tectia-server 就好了。
5:下次吸取教训,SSH 升级一定要把telnet 给打开,不管是aix, linux, 还是 sun soalris 的机器。
等全部搞定,晚上11 点了。你说 这是不是 苦逼的周末?