问题排查
文章平均质量分 83
2年半个人练习生
这个作者很懒,什么都没留下…
展开
-
jdk版本差异导致的问题排查01
项目场景: 新上线一个功能,其中需要在某模块对请求中的某个加密数据进行解码, 加密方式通过AES加密法进行加密。 需要借助javajdk的javax.crypto包下的加密工具进行解密。问题描述: 在本机写单测进行加密数据解密测试,解密成功 但是进行线上完整请求测试时,却发现相关加密数据无法正常入库,数据链路存在问题。 修改相关模块日志等级,拉取完整请求各个负责模块的相关日志,监控是否有接收到相关数据信息; 经过一番折腾与不断测试,终于锁定问题模块,并发现以下异常:java.原创 2021-07-23 00:59:05 · 3060 阅读 · 0 评论 -
kafka部分partition消息堆积问题解决记录02
项目场景:某模块A需要从kafka读取某个实时高流量的数据流消息,并将其写入磁盘文件中。问题描述:监控系统持续向负责人手机和邮箱发送短信,提示该consumer group:topic的延迟lag过高!通过监控系统web可以看到,kafka对应ConsumerGroup:topic的消息延迟Lag非常高,仅少部分分区的Lag处于正常水平,而大部分分区的Lag却不断堆积,甚至很多分区的Lag值达到了数十亿。原因分析:1、确定问题机器: 1、根据kafka部分partition消息堆积问题解决记原创 2021-07-19 15:45:54 · 1754 阅读 · 0 评论 -
kafka部分partition消息堆积问题解决记录01
项目场景: 某个实时高流量的数据流的数据统计模块,需要实时读取kafka数据并进行数种数据统计分析。问题描述: 负责关注数据流部分后,发现监控系统不断向我手机发送短信报警,报警内容指明是kafka的某个ConsumerGroup:topic的某些分区消息延迟Lag过高! 马上监控系统web端可以看到:kafka对应ConsumerGroup:topic的消息延迟Lag非常不均匀,部分分区的Lag处于正常水平,而部分分区的Lag却不断堆积,甚至Lag值超过上亿。原因分析:1、确定排查方向原创 2021-07-11 23:17:29 · 4296 阅读 · 0 评论 -
storm问题排查记录01
@TOC storm问题排查记录01storm问题排查记录011、问题发现在一次数据核验时发现我方最终统计数据量比交易所方统计数据量有较大缺失,马上对比目前数据量,发现也存在缺失情况。该问题造成了较大财产损失,需要尽早排查问题并加以修复。2、问题排查与解决 1、锁定问题产生范围 马上前往数据流途经的各个模块部署的服务器拉取日志并进行数据统计,与最初数据量做对比,最终锁原创 2021-07-04 00:39:50 · 155 阅读 · 0 评论