python文件关闭出故障_499 故障分析——Node 运维惊险排查之旅

最新推荐文章于 2023-02-28 14:40:00 发布

weixin_39636857

最新推荐文章于 2023-02-28 14:40:00 发布

阅读量309

点赞数

文章标签： python文件关闭出故障

本文链接：https://blog.csdn.net/weixin_39636857/article/details/111633120

版权

故障说明

近期，DevOps 团队成员在完善一批老服务监控指标的过程中，意外发现某服务的 access.log 中持续出现一些状态码为 499 的接口请求。与业务方沟通后确认疑似问题接口为关键业务接口，通过获取请求关联的参数，我们随机抽查了 20 条数据， 2 条在数据库中找不到相关记录，其余 18 条数据最终落库成功。基于此我们推断该故障不止会影响用户体验，而且确实会影响到关键业务指标。

分析 Root Cause

HTTP 499

An Nginx specific error code, which means that the client closed the connection before the server answered the request, usually caused by client side timeout.

根据 499 http code 的定义，说明是客户端在服务端请求返回前主动断开了连接，由于是客户端行为，再结合近期频繁的安全事件，初始时我们怀疑有人恶意攻击，故意消耗服务端资源。

是否属于恶意攻击？

我们首先找安全同事核查了 WAF 的配置和日志，但并没有收获。后面跟 ops 同事一起梳理了服务的架构，整理出该接口请求的完整链路：用户 -> WAF -> LB -> Nginx -> pm2 -> nodejs，基于此我们开始分析 499 请求的可能原因。

既然 499 说明用户端主动断开请求，那我们首先要搞清楚的是，用户端断开请求是原因还是结果。

proxyignoreclient_abort on | off;

Determines whether the connection with a proxied server should be closed when a client closes the connection without waiting for a response.

我们

最低0.47元/天解锁文章

weixin_39636857

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python文件关闭出故障_499 故障分析——Node 运维惊险排查之旅

故障说明近期，DevOps 团队成员在完善一批老服务监控指标的过程中，意外发现某服务的 access.log 中持续出现一些状态码为 499 的接口请求。与业务方沟通后确认疑似问题接口为关键业务接口，通过获取请求关联的参数，我们随机抽查了 20 条数据， 2 条在数据库中找不到相关记录，其余 18 条数据最终落库成功。基于此我们推断该故障不止会影响用户体验，而且确实会影响到关键业务指标。...
复制链接

扫一扫