测试中发现服务器整体负载较低,但有cpu负载特别高,其中一个cpu几乎一半是软中断si,特别忙,而还有的cpu特别空闲。
- top - 16:12:08 up 31 days, 3:52, 1 user, load average: <span style="color: #ff0000;">0.11, 0.11, 0.06</span>
- Tasks: 242 total, 4 running, 238 sleeping, 0 stopped, 0 zombie
- Cpu0 : 12.3%us, 14.6%sy, 0.0%ni, 70.2%id, 0.0%wa, 0.0%hi, 3.0%si, 0.0%st
- Cpu1 : 21.6%us, 22.9%sy, 0.0%ni, 7.3%id, 0.0%wa, 0.0%hi, <span style="color: #ff0000;">48.2%si</span>, 0.0%st
- Cpu2 : 16.5%us, 19.1%sy, 0.0%ni, 43.9%id, 0.0%wa, 0.0%hi, 20.5%si, 0.0%st
- Cpu3 : 2.3%us, 2.6%sy, 0.0%ni, 94.1%id, 0.0%wa, 0.0%hi, 1.0%si, 0.0%st
- Cpu4 : 0.3%us, 0.3%sy, 0.0%ni, 99.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st
先用mpstat -I SUM -P ALL 5 来看一下每个cpu的终端情况,发现cpu1和cpu2处理的中断确实很多,是什么dd在使用这两个cpu做中断呢?
- # mpstat -I SUM -P ALL 5
- Linux 2.6.32-220.13.1.el6.x86_64 (talus186) 12/26/2013 _x86_64_ (12 CPU)
- 04:15:18 PM CPU intr/s
- 04:15:23 PM all 62422.60
- 04:15:23 PM 0 0.00
- 04:15:23 PM 1 21566.20
- 04:15:23 PM 2 12123.00
- 04:15:23 PM 3 0.00
- 04:15:23 PM 4 1.00
使用 cat /proc/interrupts 查看中断情况,间隔几秒后再次cat /proc/interrupts,然后比较对应值的变化,发现eth0-1、eth0-2等使用cpu1、cpu2做中断,这两个对应的中断号分别是95,96...
- 95: 33 325897741 0 30997484 72 0 93968731 0 0 0 426 864 IR-PCI-MSI-edge eth0-1
- 96: 50 206 66609822 117 0 0 0 0 0 0 0 24437509 IR-PCI-MSI-edge eth0-2
在使用 cat /proc/irq/95/smp_affinity cat /proc/irq/smp_affinity 等看出网卡的队列都在使用cpu1 和cpu2
- cat /proc/irq/95/smp_affinity
- 00000002
- cat /proc/irq/96/smp_affinity
- 00000004
好了,把空闲的cpu用上来分摊网卡中断
- echo 08 > /proc/irq/97/ smp_affinity
- echo 10 > /proc/irq/98/ smp_affinity
- ...
再进行测试,发现cpu消耗整体还不够均衡,TOP下使用f,然后再加j,发现应用进程使用的cpu与网卡中断使用的cpu重合,再把单线程应用进程绑定到其他CPU,终于均衡下来。
最后,网卡软中断绑定cpu需要满足几个条件:1 linux内核版本必须在2.4+; 2 网卡对应的中断控制器必须是IO-APIC芯片,且需启用IO-APIC;3 部分CPU可能不支持。
其它参考:
http://www.cnblogs.com/Bozh/archive/2013/03/21/2973769.html
实例:
在自己的linux机器上:
1. mpstat -P ALL 1 或 mpstat -I SUM -P ALL 1(有的机器得用这个命令),top命令也可以
显示软中断发生在cpu0 和cpu1 , 其中主要发生在cpu0;
2. sar -n DEV 1
显示 网络读写发生在eth1
3. cat /proc/interrupts | grep eth1
显示eth1对应的软中断号IRQ为90
4. cat /proc/irq/90/smp_affinity (这一步必须root权限)
会显示十六进制的一个值, 比如: 001 表示终端分配在cpu0上, fff 表示均衡在所有cpu上(一般机器不会超过这么多cpu ,所以这个值覆盖所有cpu), 002表示终端发生在cpu1 上, 004 表示cpu2, 008表示cpu3。