问题场景:
灰度期间生产环境出现偶发性异常报错“网络连接错误”。
临时解决方案
使用app老版本,问题依然存在,确认是后台灰度问题,后台回滚对应灰度,生产问题得到临时解决。
问题查找:
查看app的请求日志id,后台查不到对应请求,且查询生产后台日志未发现报错请求。怀疑是网关服务注册问题,导致部分请求超时,查找网关对应服务注册的ip列表,对比发现有一批新的ip,运维定位为容灾环境ip(之前未开启容灾环境),运维下载容灾环境日志,发现出现对应接口超时的日志,原因为容灾环境接口未开通防火墙导致到容灾环境的流量超时。
问题反思:
开容灾环境应提前确认
1.所有配置信息对应的开墙,代理 ,白名单等信息
2.提前对接好日志查询,方便研发查日志