新到的R620运行很不稳定,宿主机外网总是无缘故down掉。决定升级下驱动看看效果

ethtool -i vmnicX 查看下当前版本。

下载vmware-esx-drivers-net- tg3_400.3.124c.v40.1-1vmw.2.17.00000.844641.iso,解压  找到BCM-tg3-3.124c.v40.1-offline_bundle-844641.zip 放到vsphere cli bin 目录下  升级:

vihostupdate –server x.x.x.x –username root –password  passwd -i -b BCM-tg3-3.124c.v40.1-offline_bundle-844641.zip

安装完成后重启 宿主机
再看 ethtool -i vmnicX

这是在本地的操作,当然你可以把驱动直接上传到服务器上再升级。

esxupdate –bundle=BCM-tg3-3.124c.v40.1-offline_bundle-844641.zip update

reboot

2013.2.27

实际更新网卡驱动并没有解决问题,继续努力中

less /var/log/vmkernel 一直能看到这样的日志开始并没有注意
Feb 26 21:09:46  vmkernel: 0:22:38:41.870 cpu0:4145)<6>tg3 : vmnic1: NetQ remove RX filter: 1
Feb 26 21:09:46  vmkernel: 0:22:38:41.870 cpu0:4145)<6>tg3 : vmnic1: Free NetQ RX Queue: 1
Feb 26 21:09:51  vmkernel: 0:22:38:46.867 cpu15:4145)<6>tg3 : vmnic1: RX NetQ allocated on 1
Feb 26 21:09:51  vmkernel: 0:22:38:46.868 cpu15:4145)<6>tg3 : vmnic1: NetQ set RX Filter: 1 [00:50:56:9c:01:f9 0]
Feb 26 21:09:56 vmkernel: 0:22:38:51.869 cpu16:4145)<6>tg3 : vmnic1: NetQ remove RX filter: 1
Feb 26 21:09:56  vmkernel: 0:22:38:51.869 cpu16:4145)<6>tg3 : vmnic1: Free NetQ RX Queue: 1
Feb 26 21:11:16  vmkernel: 0:22:40:11.866 cpu11:4145)<6>tg3 : vmnic1: RX NetQ allocated on 1
Feb 26 21:11:16 vmkernel: 0:22:40:11.867 cpu11:4145)<6>tg3 : vmnic1: NetQ set RX Filter: 1 [00:50:56:9c:01:f9 0]
Feb 26 21:11:21  vmkernel: 0:22:40:16.869 cpu16:4145)<6>tg3 : vmnic1: NetQ remove RX filter: 1
Feb 26 21:11:21 vmkernel: 0:22:40:16.869 cpu16:4145)<6>tg3 : vmnic1: Free NetQ RX Queue: 1
一位网友用的HP机器网卡为BCM5719问题描述和我们的很像:http://communities.vmware.com/thread/408890
对这个NetQ很好奇,查了下找到官网的文章http://kb.vmware.com/selfservice/microsites /search.do?language=en_US&cmd=displayKC&externalId=2035701
大概意思是说NetQ特性可以网络工作在多个CPU上,一个CPU可以处理大约3G的负载。这样对10Gb的网卡才有作用,我们的R620都是1Gb的所以关掉NetQ功能没有影响
而且官方指出关掉NetQ即可解决这个问题
在3.10和3.20上尝试了下
esxcfg-advcfg -j netNetqueueEnabled
netNetqueueEnabled = TRUE
说明已经开启
esxcfg-module -s force_netq=0,0,0,0 tg3 #关掉tg3驱动的netq功能(4个网卡)
esxcfg-advcfg -k FALSE netNetqueueEnabled # 关机esx主机的netq功能
图形界面下也可关闭 在主机-配置-高级设置-vmkernel-boot- VMkernel.Boot.netNetqueueEnabled把勾去掉,迁移机器到其他前端,重启宿主使更改生效。

现在还不知道效果如何,继续观察

PS:已经一周多过去了,看来问题就是在这里了