利用linux处理网络流量数据

周海汉/文 2009.1.15
ablozhou #gmail.com
网络压力测试,需要处理原始数据,将原始的Byte/s 处理为Mbps,并通过直观曲线图表展示出来。
1.统计网卡流量
sar -n DEV 1 100 > net
得到网卡流量,原始数据如下:
10:32:41 IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s
10:32:42 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:32:42 eth0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:32:42 eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:32:42 sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:32:42 IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s
10:32:43 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:32:43 eth0 79164.00 79161.00 8581912.00 8574255.00 0.00 0.00 0.00
10:32:43 eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:32:43 sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
...
10:34:19 IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s
10:34:20 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:34:20 eth0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:34:20 eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:34:20 sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:34:20 IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s
10:34:21 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:34:21 eth0 79657.00 79657.00 8602734.00 8606166.00 0.00 0.00 0.00
10:34:21 eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:34:21 sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s
Average: lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: eth0 40091.69 40091.51 4329888.64 4331543.93 0.00 0.00 0.00
Average: eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
其中rxbyt/s 表示每秒接受的byte数,txbyt/s 表示每秒发送的byte数。我们可以将其加工成Mbps
2. 我们需要处理 eth0网卡的流量,将其余流量去掉
cat net | grep eth0 > net1
我们得到数据如下:
10:32:42 eth0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:32:43 eth0 79164.00 79161.00 8581912.00 8574255.00 0.00 0.00 0.00
...
10:34:20 eth0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
10:34:21 eth0 79657.00 79657.00 8602734.00 8606166.00 0.00 0.00 0.00
Average: eth0 40091.69 40091.51 4329888.64 4331543.93 0.00 0.00 0.00
3.我们需要处理rxbyt/s ,txbyt/s 将其余的列去掉
gawk '{print $5,$6}' net1 > net2
gawk 命令的执行格式:
gawk '模式匹配|命令语句 {动作}' 处理文件
我们这里没有模式匹配和语句,直接执行动作,打印第5第6列。
得到数据如下:
0.00 0.00
8581912.00 8574255.00
0.00 0.00
8723086.00 8726654.00
0.00 0.00
8718490.00 8721642.00
0.00 0.00
8558670.00 8562184.00
...
0.00 0.00
8602734.00 8606166.00
4329888.64 4331543.93
4.以上的数据,每行代表1秒,但网卡流量每2秒才能取到一次数据。所以是奇偶相间的数据。第0行开始的偶数行都是0. 我们将偶数行的 0 去掉。
这里方法很多。
a.) sed -n '{n;p}' net2 > net3
该命令表示用sed,隔一行打印一行。单引号里大括号的n表示跳到下一行,分号分隔命令,p表示打印命令。 -n表示安静模式,只打印输出。否则会读一行打印一行。
b.) gawk '$1 != 0.00 ' net2 > net3
gawk 可以带if表达式,循环,功能很强。因为数据很有规律,我们可以偷点懒,直接将第一列是0.00的数据行删掉。该命令表示第一列不等于0.00就打印出来。
5.将byte/s 处理为Mbps,并求2秒的均值。
gawk 'a=$1*8/(2*1024*1024), b=$2*8/(2*1024*1024){print a,b}' net3 > net4
将每一列的值*8,得到bit数,除以1M,得到Mbps,除以2得到均值,并赋给变量a,b。再打印出a和b的值。
6.将文件处理为csv文件,再通过excel程序来生成统计图表
用vi将最后一行平均值去掉。并可以在vi中用:%s/ /,/g 将空格替换为逗号,:w net.csv
7.用winSCP将net.csv传到windows,用excel 2007打开。
选中这两列数据,点插入,折线图,得到如下的图。可以调整一下标题和坐标说明。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值