应用软件系统割接、上线处理问题经验谈(非软件开发原因)

1、故障现象一:应用系统服务在部署到生产环境上后,与门户系统服务连接不通,开发、测试环境上仍然好使。
      通过比对应用程序,以及开发、测试、生产环境,发现应用程序只是 “按要求修改原测试IP地址为生产域名地址”,最后,在生产环境服务器上使用ping命令,测试直接连接域名地址,结果不同,故障诊断初步结论是网络原因。
      故障分析结果是域名配置时,多写了个字符。
    经验总结:
      在做复杂环境(多厂家、企业大型网络)上部署应用时,应该先自行检测涉及到自身的所有网络连接(开发、测试、模拟、生产环境),及时发现问题,提高工作效率。

2、故障现象二:在集群环境上,新改造应用上线后,偶尔出现空白页404错误。
      初步怀疑是部署应用代码不一致的问题,但是很难定位。经研究定位问题方法是请网络人员,控制负载交换机,只保留一台服务器网络通,测试时,故障现象未发生,怀疑问题解除。
      接着怀疑系统平台问题,检查Apache错误日志,在分析到其中一台服务器时,发现了空白页的错误日志,指定文件找不到,而此文件早已经存在多年了。
      在未做任何处理的情况下,第二天故障消失了!
      经验总结:
      出故障时,软件开发人员首先怀疑自身的问题是对的,但要想办法尽快排除怀疑、定位问题。

3、故障现象三:在集群环境上,新部署的门户接入部分,偶尔出丢失传递参数的错误。
      初步怀疑是部署应用代码不一致的问题,但是通过比对代码,各台服务器上的都都一致。
      经过分析、调试确诊故障出在代码备份操作上,问题是把原代码文件更名备份后,仍放在Apache应用目录下,而Apache服务仍识别是旧代码,新代码文件实际上未生效。
      经验总结:
      在更新备份时,要把原代码移走到服务以外目录下备份。

4、故障现在四:在集群环境上,有两台服务器的服务失效,整个系统响应变慢。
      经分析、诊断,是这两台服务器的时钟与其他服务器不一致。
      经验总结:
      在集群环境上,应在每台服务器上部署时钟同步服务。


待续......
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

肖永威

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值