生产Aix服务器文件已经迁移了几次,一直没有成功,运维的领导已经不满。后台日志发现报错out of memory,查看相关的内存指令发现,oracle进程占内存较大,后来发现其实并不是。今晚联系到数据库的运维人员把oracle服务给停掉了。
1.kill带来的隐患
shutdown掉oracle的进程之后,发现对内存的改观并不是很大。有一个usr文件夹里面有,一个大的文件nmbd.log,百度是samba服务在运行过程中打的日志,上次已经删除掉,但是估计由于aix系统原因,不重启不释放相关内存的原因,一直导致该文件夹100%占满。就想着那要不要把samba服务停掉,然后我们就可以正常的把usr内存给释放出来。然后鬼使神差地使用了ps-ef|grep nmbd。发现有两个nmbd的 process进程。先kill掉了第1个没有反应,接着把第2个也杀了。哦吼,完蛋,发现突然连接中断,公司的堡垒机ssh连不上服务器了,ping也无法通。然后就想着要联系机房的人员进行服务器的重启。
2.一波三折,机房人员竟然只是手动点了开关机键
不知是我们描述的不够清楚,还是机房本来的操作水平就不够高,结果他们就是手动点了关机键。机房人员反馈他们摁了很长时间,机器还是没有反应。在此期间我们也尝试一直去连接服务器,过了一会儿服务器能连接上了。竟然好了,有点开心。然后发现后台进程什么都没有,需要把weblogic和