有疑问或深入讨论可加qq: 2542956244
1. LVS故障:
背景: 近日因公司大促, mysql从服务器前端共享的一台LVS因流量跑到2Gps 而出现 LVS丢包, Client端代码不停抛出mysql connect failed异常.
故障特征:大流量时为LVS的CPU其中一个core使用率100%, 其他23个core使用率小于10% ; 明显地
根本原因: LVS使用Linux内核为2.6.18, kernel处理入站数据包时全部交给一个核心处理;
解决方法: 升级OS为kernel 2.6.32以上版本, 使用支持MSI-X网卡(现市面大部分机型如Dell R730、HP DL580都支持), LVS软件调优
优化效果: top的si%(软中断)平均分布到所有核心, 单机承载力上升400%, new_connection处理能力从3w上升到20w, 流量承载力从700M上升到1500M.