前言
在信息化的建设过程中,都会提到业务系统的性能问题。我们当然希望系统的性能越稳 定越好,但是在实际的使用过程中,总是接到用户的反馈说业务系统出现了问题,那么如何 保证业务系统的健康性,保障业务使用的连续性,站在最终用户的角度来监测业务系统呢?
背景
SAP应用是某汽车集团至关重要的业务应用系统,一旦该应用出现缓慢或性能不佳的情况,将会对企业收入造成重大损失。最近一段时间运维人员经常接到反馈,SAP使用出现大量访问慢的情况。因此,SAP性能监控和用户体验监测变得尤为重要。
某汽车总部已部署NetInside流量分析系统,使用流量分析系统提供实时和历史原始流量,重点针对SAP系统性能进行分析,以供安全取证、应用事务分析、网络质量监测以及深层网络分析。
分析对象和目的
此次针对SAP应用中2台服务器的流量进行监测,地址分别为:xx.xx.xx.72,xx.xx.xx.172。重点针对SAP性能进行分析。
通过监测分析,发现存在性能问题的SAP访问,并进一步深入分析出现性能问题的根因。
系统架构和分析原理
系统架构
SAP应用分为开发系统、测试系统和生产系统。
开发系统、测试系统分别连接单台数据库。
生产系统的多台服务器连接数据库集群。
注:本次针对生产环境xx.xx.xx.72,xx.xx.xx.172进行分析。
数据采集原理
NetInside流量分析系统采用旁路方式采集性能数据,对网络、业务、用户等不会造成任何影响,做到稳定、精确、实时和灵活的数据采集。
分析结论
发现SAP应用的用户体验出现性能情况,主要是服务器响应时间高,分析服务器和客户端真实情况,并附上出现性能问题时的事务码信息。
分析过程
自动识别SAP
NetInside分析系统能自动识别到SAP应用。
详细分析SAP
发现SAP服务器响应时间长
一天中SAP性能情况如下,找到一个服务器响应最长的高峰点,2022年10月9号 9:15分,服务器的响应时间为39.971秒,如下图:
注:最高点服务器的响应时间为39.9714秒。
服务器总体情况
分析发现,当前慢的节点是服务器地址xx.xx.xx.72的机器出现的高点,具体指标如下:
注:服务器响应时间8.0037秒为分析这段时间平均时间。
客户端情况
分析发现,服务器xx.xx.xx.72的对应客户端具体指标如下:
注:客户端仅有一个客户端,服务器响应时间8.0037秒为分析这段时间平均时间,确定此IP xx.xx.xx.57为高峰点服务器响应慢的地址。
解码分析
针对服务器响应时间最高点,下载数据包解码分析发现如下图:
注:在No 49到No 50可以看到,响应时间为39秒。
事物码分析
针对39秒的一个响应,已经分析到解码后的事务码层,如下图:
注:应用中其它类似的问题都可以使用相同的方法流程分析。
(本次分析时间段为2022-10-09 00:00到2022-10-10 00:00)
分析建议
为了更好的监控和分析SAP性能,建议针对目前已分析定位到事务码,我司技术人员需要SAP相关技术人员的配合进一步定位问题。