![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Java
Citronnelle2
这个作者很懒,什么都没留下…
展开
-
一次线上服务故障应急问题总结
昨天负责的项目出了个故障,从发现故障到线上服务恢复耗时一个小时,故障应急的效率存在很大问题。这里总结一下故障期间存在的问题。首先是故障现象:评论列表页评论内容加载不出,一直在转小圈圈,服务端监控显示有大量NP异常。因为故障发生在我刚上线完服务五分钟左右,第一反映是回滚代码。服务报警还在继续,怀疑是发布系统回滚有问题(因为当时恰逢公司在升级新版发布系统,我找了个历史包发布,实际发布的原创 2017-05-20 16:35:30 · 1944 阅读 · 0 评论 -
Mysql主从延迟过高导致的case
昨天同事遇到了一个线上case,主要现象是部分用户下单成功,但是却查不到订单详情信息,追踪到订单表里,发现部分订单并没有更新状态。 排查: 用户下单的后台服务逻辑最近并未做改动,分析报警日志发现,在下午四点到五点之间有部分空指针异常,定位到代码如下: 显然这里查询到的订单DTO为空,造成了空指针异常。正常的下单逻辑是,用户创建订单-在本地db生成订单-调用订单中心rpc接口-订单中心创建原创 2017-06-02 15:16:29 · 1529 阅读 · 0 评论