一、故障简述
故障描述:
采购计划无法新建/分派,按钮不展示
二、故障处理过程
9月11日20:00 用户中心web-middle应用的容器化,导致路由改变
9月14日10:26 修远反馈真线环境https://pay.zcygov.cn/api/privileges/getElementsForSettle转发有问题
片风检查了配置,发现nginx 转发/api/privileges/getElementsForSettle到/api/privileges/getElement,容器网关里面其实配置了/api/privileges/getElement的转发,但却没有生效,原因是该该域名以及uri是转发到后端web-purchaseplan的
9月14日10:31 片风修改pay.zcygov.cn & /api/privileges/getElement 转发至web-middle, 之后让修远进行功能验证,修远反馈功能Ok
故障开始9月14日 10:48(+0) 运营反馈 采购计划无法分派
故障响应9月14日 10:53(+5) 运营反馈 采购计划无法新建,技术支持响应排查问题,因为无报错截图,引导运营查看岗位权限
故障处理9月14日 10:54(+6) 联系采购计划开发排查
10:59 技术支持与运营确认账号身份、岗位问题
11:05 在采购计划开发处确认所有采购计划均受影响
11:11 发送P2故障通告,同时故障快速处理群同步信息
11:19 白杨反馈getElement接口是采购计划提供的,并非权限应用直接提供,由此推测可能是路由转发配置错误,由于9月11日用户中心进行了多个应用容器化,涉及nginx的转发配置重配,因此推测可能是由于该原因导致,联系片风进行排查
11:22 片风回滚了该配置改动,采购计划故障恢复,结算单问题复现
故障恢复9月14日 11:22(+34) 故障修复
11:36 片风修复了结算单问题
三、影响产品线及影响面
采购单位 采购计划无法分派/创建
四、故障原因
同一个域名pay.zcygov.cn 的同一个请求uri /api/privileges/getElement 需要转发到不同的后端服务。
为了区分这个转发的不同,在nginx端做了转发逻辑,即外部访问pay.zcygov.cn/api/privileges/getElementForSettle, 转发请求到web-middle /api/privileges/getElement。
web-middle 转发配置:
location ~ ^/api/privileges/getElementsForSettle {
proxy_pass http://zcy_middle/api/privileges/getElements?$args;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header Host $http_host;
proxy_set_header requestId $request_id;
}
web-purchaseplan转发配置:
location ~ ^/api/(budget|metadata|basedata|metaData|purchaseplan|privileges|report/purchaseplan){
proxy_pass http://zcy_purchaseplan;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
proxy_set_header Host $http_host;
proxy_set_header requestId $request_id;
}
在容器化的时候没有识别到这个风险,导致两个路由冲突
问题修复的方式,是把nginx端的转发逻辑从nginx挪至ingress, 让ingress能识别到不同的uri, 并转发到不同的后端。
五、故障评级
故障等级:P2
故障类别:误操作-配置错误-nginx配置
六、后续ACTION:
七、预案: