记录下本次ERP巡检时遇到的问题,仅做自己经验总结。
2013-6-30,周日,去往南昌的飞机晚点两个小时,据说飞机飞到济南无法降落,又飞回南昌,然后再飞回来,不知道真假。
2013-07-01, ERP巡检
早晨7点40出门,热气笼罩全身,第一次感受到九江如此“热情”。
巡检中发现一个大于100M的索引无法REBUILD,问题是所在的数据文件有坏块,查ALERT文件,发现2012年就有该问题。对客户算有个好的交待,后面先在测试环境实施解决方案,再应用到生产环境。
2013-07-02,SUN服务器磁盘掉落,硬件维护公司初步判断是断网造成。挂好磁盘陈列后,DB正常,可登陆生产环境。
注定了这次巡检有诸多的不顺,但想想是可以学到很多东西。
磁盘掉落的时候,正在删除系统中的测试环境。用户发现生产环境的目录文件都不见,第一反应怀疑我进行了误操作,各种解释,并给他检查我执行的命令。我是吓出一身冷汗。后来发现是磁盘陈列从目录结构中掉落。其实可以: df -h的。
2013-07-03,业务人员反应部分Form表单无法访问。开始重启AP层,关闭时,部分脚本exit status为2。包括:adapcctl.sh, adfrmctl.sh, adfrmsctl.sh。单独执行脚本也出现同样错误。尝试启动AP层,仍报错,提示Apache server already started。再关闭服务,会提示Apache server already stopped。Kill相关进程,系统会再创建出来新进程。以前没遇到这种问题。咨询了一个前同事徐斌老师,给了很中肯的方案。按如下步骤进行操作:
1)执行adstpall.sh
2)adapcctl.sh status
stopped , exit status 2
3)adfrmctl.sh status
stopped, exit status 2
4)adfrmsctl.sh status
stopped, exit status 2
判断AP已关闭。
5)关闭数据库层,数据库正常关闭,exit status 0。此时Kill Appache相关进程仍然会出现新进程。
6)重启SUN服务器。
关闭进行缓慢,有Warning,提示大家temprature limited 68 C。
好吧,猜测昨天的磁盘陈列掉落和温度相关。