调查服务器响应时间的利器 tcprstat

转载 2013年12月06日 00:31:03

我们在做服务器程序的时候,经常要知道一个请求的响应时间,借以优化或者定位问题。 通常的做法是在代码里面加入日志计算时间,这个方法有问题,时间不准确。因为数据从网卡到应用程序,从应用到网卡的时间没有被计算在内。 而且这个时间随着系统的负载有很大的变化。
那同学说,我wireshark, tcpdump抓包人肉统计不行吗。 可以的,只不过我会很同情你,此举需要耐心且不具可持续性。 所以我们希望有个工具能够最少费力的做这个事情。

这时候来自percona的tcprstat来救助了! 这个工具原本开发用来调查mysqld的性能问题,所以不要奇怪它的默认端口是3306, 但是我们可以用这个工具来调查典型的request->response类型的服务器。

什么是tcprstat:

tcprstat is a free, open-source TCP analysis tool that watches network traffic and computes the delay between requests and responses. From this it derives response-time statistics and prints them out. The output is similar to other Unix -stat tools such as vmstat, iostat, and mpstat. The tool can optionally watch traffic to only a specified port, which makes it practical for timing requests and responses to a single daemon process such as mysqld, httpd, memcached, or any of a variety of other server processes.

文档很详细: 请参考: http://www.percona.com/docs/wiki/tcprstat:start

不愿意编译的同学直接从这里下载64位系统的编译好的二进制:http://github.com/downloads/Lowercases/tcprstat/tcprstat-static.v0.3.1.x86_64

源码编译也挺容易的: 由于它自带libpcap包, 这个包有可能在configure的时候没认识好netlink, 只要把config.h里面的netlink那个define注释掉就好。

编译好了, 典型使用很简单:

# tcprstat -p 3306 -t 1 -n 5
timestamp	count	max	min	avg	med	stddev	95_max	95_avg	95_std	99_max	99_avg	99_std
1283261499	1870	559009	39	883	153	13306	1267	201	150	6792	323	685
1283261500	1865	25704	29	578	142	2755	889	175	107	23630	333	1331
1283261501	1887	26908	33	583	148	2761	714	176	94	23391	339	1340
1283261502	2015	304965	35	624	151	7204	564	171	79	8615	237	507
1283261503	1650	289087	35	462	146	7133	834	184	120	3565	244	358

但是这个tcprstat在bonding的网卡下有点问题:

# /sbin/ifconfig
bond0     Link encap:Ethernet  HWaddr A4:BA:DB:28:B5:AB
          inet addr:10.232.31.19  Bcast:10.232.31.255  Mask:255.255.255.0
          inet6 addr: fe80::a6ba:dbff:fe28:b5ab/64 Scope:Link
          UP BROADCAST RUNNING MASTER MULTICAST  MTU:1500  Metric:1
          RX packets:19451951688 errors:0 dropped:4512 overruns:0 frame:0
          TX packets:26522074966 errors:0 dropped:0 overruns:0 carrier:0
          collisions:0 txqueuelen:0
          RX bytes:6634368171533 (6.0 TiB)  TX bytes:32576206882863 (29.6 TiB)
...
# tcprstat -p 3306 -t 1 -n 5
pcap: SIOCGIFFLAGS: bonding_masters: No such device

解决方案是:

以下是代码片段: # sudo tcprstat -p 3306 -t 1 -n 0 -l `/sbin/ifconfig | grep ’addr:[^ ]\+’ -o | cut -f 2 -d : | xargs echo | sed -e ’s/ /,/g’`

用IP地址方式,而不是网络接口方式搞定。

祝大家玩的开心。

from:http://blogread.cn/it/article/2980?f=wb

相关文章推荐

Linux虚拟机复制网卡启用不了

虚拟机复制到新的机器上之后网卡启动不了,是因为复制之后网卡的MAC地址 变了,启动网卡的配置文件的网卡名称,和配置文件的mac地址改为正确即可。 1.查看当前网卡名称和MAC地址 [root@cent...

Too many open files -- linux文件描述符的限制调整

这两天做asterisk的性能测试,经常碰到这样的错误:“Too many open files”。         我们知道,Linux下,文件描述符就是一个简单的整数值,习惯上,标准输入(sta...

调查服务器响应时间的利器 tcprstat

我们在做服务器程序的时候,经常要知道一个请求的响应时间,借以优化或者定位问题。 通常的做法是在代码里面加入日志计算时间,这个方法有问题,时间不准确。因为数据从网卡到应用程序,从应用到网卡的时间没有被计...
  • lwuit
  • lwuit
  • 2012年02月29日 17:28
  • 1328

java测试服务器响应时间

  • 2012年08月25日 11:50
  • 2KB
  • 下载

多线程检测服务器响应时间小工具

在日常工作当中,网络不稳定时有发生,由于该类问题往往呈现不稳定,时好时坏的情况,所以,进行一段时间的连续监测是必要的。由于需要长时间监视,为了防止前台卡死与资源消耗,采用线程来进行网络监测。...

AJAX应用案例--不刷新整个WEB页面显示服务器响应的当前时间

在不刷新整个WEB页面的情况下,点击按钮显示服务器响应的当前时间 。 JSP页面代码: My JSP 'createAjax.jsp' starting page ...

servlet作为服务器响应请求.zip

  • 2016年07月14日 21:30
  • 17KB
  • 下载

关于服务器响应,浏览器请求的理解以及javaWeb项目的编码问题

1.服务器(Server)响应,浏览器(Brower)请求:   对于B/S的软件,数据的传递体现在,用户利用浏览器请求,以获得服务器响应。在JavaWeb项目中,大致包含.java文件的数据处...

邮件:事务失败。 服务器响应为:DT:SPM 163 smtp

几年前我做的一个项目,日发邮件最高峰时几十万。自以为对邮件发送方面已经有了一定认识,所以近期机缘巧合之下,又有项目需要发送邮件,不禁自信满满,暗自庆幸能不手到擒来乎?不想老革命遇到新问题。我原先的邮件...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:调查服务器响应时间的利器 tcprstat
举报原因:
原因补充:

(最多只允许输入30个字)