问题场景:生产环境一个报表的后台作业,因为atp检查函数内部dump,导致作业终止。
分析过程:
我检查了这个dump的日志,抛出异常的位置在调用标准ATP检查函数的内部,从日志上来看,应该是当时sap数据库连接出现异常。
因为这是一个自定义程序,每天定时一次的后台作业方式运行。通过SM37查看近一段时间的该程序的作业情况,发现只有一次是失败的
时间点在早上5点。
查看了sap notes:2270438.pdf;1397394.pdf;1677504.pdf
基本断定是当时系统服务器可以中断过,于是立马向basis相关人员询问当时系统是否在做什么操作,得到了他们的答复是系统当时
有在重启。这样终于排除了程序bug的问题,也吻合了自己的分析以及notes的解释。
SAP系统日常运维过程中,很多时候出现问题有可能是系统故障或者用户操作不当导致数据不准确,但很多情况下都会怪到开发人员
身上,说程序是bug,只有先找出实际原因说服了自己,才可能说服用户。
问题原因:系统中断
参考资料:notes 2270438;notes 1397394;notes 1677504.
本文记录了一次SAP环境中后台报表作业因系统重启导致失败的排查过程。通过对dump日志及SAP Notes的研究,结合系统运维信息,最终确定了问题是由系统中断引起的。
1373

被折叠的 条评论
为什么被折叠?



