你遇到过的测试难题（6）记一次xxl-job的故障失败没有重试机制

Tommy.IT

已于 2024-05-08 23:28:45 修改

阅读量801

点赞数

分类专栏： # 棘手测试测试工程师文章标签： java 中间件分布式软件测试

于 2022-03-09 23:38:12 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30864373/article/details/123389402

版权

测试工程师同时被 2 个专栏收录

48 篇文章 10 订阅

订阅专栏

7 篇文章 1 订阅

订阅专栏

你遇到过的测试难题（6）记一次xxl-job的故障失败没有重试机制

你遇到过的测试难题（6）记一次xxl-job的故障失败没有重试机制

你遇到过的测试难题（6）记一次xxl-job的故障失败没有重试机制

业务背景

次日凌晨零点开始，获取前一天符合条件的用户，然后将这一部分的用户筛选出来并做好记录
一般都是参加了某活动并达标了的用户；或者是参加某活动送送什么东西之类的

线上故障表现

查询订单记录发现符合条件的用户有1W个，实际记录里面只有100个用户

故障结论

由于其他发版导致失败、延时影响到原有xxl-job的定时器，xxl-job我这就都管他叫定时器吧。

因为定时器在0点的时候就触发，但因为某些原因，业务层面，服务层面，硬件层面，到时失败没有办法正常处理。

因为硬件坏那服务就只一个坏；
业务坏那一定影响客服端，有报错日志，有客户端会反馈。
所有剩下的就是服务端的问题了呀，显然这一次应该就是服务层面，就其他服务的定时器都正常，唯独这一个就挂了。

定时器挂了之后，也没有执行重试，也没有告警

测试过程

只做了功能，点点点，而且在有限的时间里面，根本缺很多边界、异常的思考，确实没有有容灾，容错的考虑。
因为业务为先，功能优先，往往坑就这样来了，挂在活动结束的最后一天。OMG!!!

总结

1.需要在错误中吸收经验
2.了解一下业务的中间件，比如mq，xxl-job的机制
3.测试、开发如何规划容错，容灾，兼容等灾难机制的响应（通常紧急需求，必踩坑）
4.关于告警的设置，如何定义，业务有没有给出一个数来定义，什么时候该告警
5.开发有没有考虑重试的机制，日后有必要对所使用的中间件特性说明清楚

对bug要有敬畏之心，从错误当中积累好经验，提高风险意识！正因如此才有跟多的动力去推动自己学习，虽然功能上面没有问题，但锅还是要背，bug还得修啊，给大家收集了一个难忘的bug

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
你遇到过的测试难题（6）记一次xxl-job的故障失败没有重试机制

你遇到过的测试难题（6）记一次xxl-job的故障失败没有重试机制## 业务背景次日凌晨零点开始，获取前一天符合条件的用户，然后将这一部分的用户筛选出来并做好记录一般都是参加了某活动并达标了的用户；或者是参加某活动送送什么东西之类的## 线上故障表现查询订单记录发现符合条件的用户有1W个，实际记录里面只有100个用户## 故障结论由于其他发版导致失败、延时影响到原有xxl-job的定时器，xxl-job我这就都管他叫定时器吧。因为定时器在0点的时候就触发，但因为某些原因，业务层面，服务层
复制链接

扫一扫

专栏目录

博客等级

码龄9年

57
原创

90
点赞

458
收藏

89
粉丝

关注

私信

热门文章

分类专栏

最新评论

python+barcode快速生成条形码3-PyQt6微界面（电商条形码生成工具）
m0_68094385: 我想要
python+barcode快速生成条形码（电商测试小工具）
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
冒烟测试用例规范
Tommy.IT: 这个其实可以做作为以参考的方法，没有必要完全理解，目前还是按照自己公司，去做人性化的定制就可以了，或者粗暴一点就10冒烟测试用例，不管难易
冒烟测试用例规范
qq_39208093: 您好，请教一下这个项目权重占比和用例权重占比是怎样得出的呢
测试工程师与AI chatGPT，编写python读取xmind测试用例chatgtp+python+xmind
Tommy.IT: 效率这个嘛，目前我没有任何数据可以支撑或者说出个一二；如果从点点点的测试来说，构造测试场景，有一定的帮助，比如：一下子造几万条数据；一下次生成千字长文本；从其他角度的话就是，AI怎样能提供更多的开发思路、开发启示；目前我日常使用AI一方面解决些重复工作，一方面解决思考瓶颈，一方面解决纠正纠错；最后效率提高多少这个要结合使用者本身，还有结合项目本身，以及代码整体管理监控

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。