1. 应用层 通过tsar 或 sar 就可以看到 tcp retran指标 网络重传率,如果这个比例很高 基本可以断定网络有问题 ,或者应用引起的类似网络问题
2. 通过tcp抓包 可以看到 是否有丢包。
有个案例网络一直丢包,原因:
网络使用minilvs\,上面的bond0网卡gro设置标准是on,会合并报文成大点的包。minilvs没有办法处理大包,可能出现失败。所以要在物理网卡层面比如eth0,eth1,2,3把gro设置为off。我们推荐的配置就是bond0网卡gro为on,物理网卡gro设置为off。 目前minilvs7台物理机现在确认都是正确配置。 (bond0 是虚拟网卡 ,eth0 ~n 是物理网卡 ,他们通过配置 使得bond0 是高可用 有负载均衡 和 master slave等模式 https://www.cnblogs.com/dkblog/archive/2011/08/30/2160204.html)
还有些情况:
所有的网卡发的中断都被一个cpu核绑定处理,导致cpu的那个核 忙不过来 而丢包 refer to https://www.cnblogs.com/bamanzi/p/linux-irq-and-cpu-affinity.html