一、业务现象反馈:
夜里1-6点客户端会收到来自负载vsip反馈的rst数据包,占总体业务量的大约千分之一,数量较多,影响业务,业务观察到访问服务器端的ip非vsip,怀疑做了snat导致问题发生。
二、网络与业务确认基本信息:
1、业务影响时间
答:白天没有问题
2、业务上线就一直有问题还是后期出现的问题
答:应该是一开始就有问题,就是一直没注意,只有凌晨有问题就没怎么关注过
3、白天夜间业务量变化
答:白天是夜间的几倍
4、client业务访问的请求是什么协议什么类型
答:http post
5、vs后台的服务器随机抽查网关配置
答:经过查看有指向源地址的下一跳为负载floating-ip的路由
三、网络定位流程:
1、通过查找业务提供的访问服务器的源ip,发现是负载在该业务vlan的floating-ip。
推断:如果是snat模式那应该是snat地址,如果是透传模式那应该是vsip地址,
2、通过查看配置发现设备是透传模式,那应该访问服务器的源地址是vsip,不应该是floating-ip
推断:既然没有配置snat,源ip还是发生的变化,影响源ip的配置有可能是VS的L4-L7的类型配置、或者irules配置
3、通过查看配置发现该vs没有关联irules,且Type为Performance(http),相应的profiles为fasthttp
判断:通过抓包发现源访问vs,vs确实被转换成了floating-ip了,经过与厂商支持沟通,得知该FastHTTP profile模式下负载会做强制snat。现在可以理解为什么是floating-ip去访问服务器了。
该模式存在强制snat的依据:
4、通过观察另一中心(同样业务但业务无报错)的负载配置,发现确实type在这里有所不同,大概可以定位是这个原因,不过问题依旧没有解决
①、为什么floating过来访问会存在问题
②、为什么晚上是部分业务报错
③、为什么白天没有报错
四、总结