线上问题
文章平均质量分 88
线上发生的事故和问题集锦
夜勿语
热爱技术,分享技术,博客园地址:https://www.cnblogs.com/yewy/
展开
-
线上问题——学习记录幂等判断失效问题分析
这次的问题好在对业务没有什么影响,但代码确实写的有问题,考验了对锁、事务以及框架的总和运用和理解。另外在分析问题时不要想当然,先入为主,一定要大胆猜想、亲手验证,只要有发现一点疑点就不应该发放过,因为很有可能就这一个疑点就推翻之前所有的分析。最后附上链路:F947DF6DC8C94E339ED1BAC5AF5E9812(edu-study、edu-study-async),感兴趣的看官可自行分析验证,有问题欢迎指出。原创 2024-03-04 20:57:28 · 1023 阅读 · 0 评论 -
线上问题——2021-12-27 父子线程共用线程池导致死锁故障
从早上6点开始edu-wings-admin的timer-task和mq就开始报警任务堆积,且数量持续上升,到6点50左右mq也开始告警,8点左右发现问题,开始排查,直到11点才找到问题,任务开始正常消费。原创 2024-03-03 14:20:18 · 349 阅读 · 1 评论 -
线上问题——事务内加分布式锁
一、业务流程上图是对save和saveScore两个接口的流程抽象,save是上传答题数据,saveScore则是上传答题分数,为保证幂等和防止并发调用,这两个接口都加了分布式锁(还是两层哦)。第一层使用的是不同的锁,因为处理的是不同的表,第二层处理的是相同的表,为了保证数据在某个维度上的唯一,所以使用了相同的锁。本篇文章则主要记录下表C中的逻辑唯一键出现重复数据的问题排查过程,该问题包含了对锁、事务及Mybatis框架的综合运用和理解。二、问题分析ROUND 1问题分析最开始只看到了第二层锁的原创 2022-05-01 16:11:52 · 2481 阅读 · 0 评论