利用科来网络分析系统解析ERP服务器响应慢<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

 

1 .故障描述

       月底客户反映内网ERP服务器访问速度慢,财务部门月报无法生成。经了解服务器有两台10.xx.3.160ERP应用服务器,10.xx..3.161ERP数据库服务器。

<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />

2.软件部署

       1)首先根据网络拓扑选取ERP交换机作为抓包点,对交换机上联口配置端口镜像,将科来网络通讯分析系统2010接到镜像端口上。

       2)启动科来网络通讯分析系统2010,在“网络适配器”窗口中选择抓包网卡。

       3)在“网络档案”窗口新建“ERP服务器分析”的网络档案,设定网络带宽为1000Mbps

       4)在“分析方案”窗口中新建“ERP服务器分析”分析方案,选取所有“分析模块”,

点击“下一步”按钮,在诊断里,选择所有诊断事件,点击“完成”。

       5)选择“ERP服务器分析”网络档案,“ERP服务器分析”分析方案,点击开始按钮开始分析。

3.数据分析

       1)抓取一段时间的数据包后,停止抓包,开始分析。

       2)首先从图表功能可以看到,ERP服务器区带宽带宽最大值为781.250KB/s6.25Mbps),同时流量最大的主机为10.xx.3.161,流量最大的协议为ERP协议。

 

       3)在概要视图中我们发现“诊断统计”事件较多。

       4)进入“IP端点视图”,可以看到ERP服务器10.168.3.16010.xx..3.161的流量不大,其TCP会话数也比较正常,发送数据包和接收数据包数量也比较正常。

       我们打开一个连接的数据包进行详细分析,如下图:

       通过观察TCP通讯过程我们可以看到,第5个数据包和第6个数据包之间的延时约为5.4秒。通讯过程如下:首先服务器10.xx..3.161连续发送3个数据包123,然后客户端给出了前两个数据包的确认(数据包4),第5个数据包为第3个数据包的确认,通过分析发现,虽然第5个确认包已经发送给服务器,但是服务器没有继续给客户端发送数据,以确认收到客户端的确认包5,而客户端在等待5.4s后,认为服务器没有收到第5个确认包,所以重传了确认数据,这就造成了客户端访问服务器10.168.3.161慢的现象,观察服务器10.xx..3.161的其他TCP连接存在相同的情况。

       分析10.xx..3.160发现存在类似情况,如下:

       因此我们确定问题出在ERP服务器上。(本次抓包未分析ERP应用服务器和ERP数据库服务器之间的交互)。

 

4.分析结果

       通过查看网管软件发现网络设备运行状态良好,同样在服务器区域的其他同一网段服务器运行正常,所以基本排除网络故障造成的ERP访问速度慢的可能。通过科来网络通讯分析系统2010在服务器所接的交换机进行抓包分析发现,TCP通讯过程存在严重的重传问题,延时的产生主要是由于重传造成的,因此我们怀疑服务器工作不正常。

可能原因如下:

1) 服务器缓存溢出

2) 服务器响应慢

3) 数据库查询速度慢

4) ERP应用与ERP数据库交互出现问题

解决方法:

1) 提高服务器性能

2) 对数据库进行优化

3) 通知ERP厂商对服务器进行检查