实战经验
文章平均质量分 94
以实战排查问题为主。介绍的都是实际工作中遇到的疑难问题,以及在工作中真正落地的技术方案或最佳实践。将最真实的工程经验分享给大家。
Alan CGH
从500强外企干到头部二手电商公司,目前流落到央企搞数字化
展开
-
一次数据库假死的排查过程
那是大半年前的一次线上DB故障。原创 2024-07-28 23:55:09 · 568 阅读 · 0 评论 -
K8S Docker搭建RocketMQ Dledger高可用集群
讲解RocketMQ最流行的3种集群部署模式以及它们之间的差异。带你用3台小机器结合K8S和Docker搭建一个高可用具备failover能力的生产集群。实现TPS 6000和百万消息收发的RocketMQ集群。原创 2024-08-04 10:31:58 · 998 阅读 · 4 评论 -
canal消费binlog异常排查
在生产上遇到了canal同步es数据突然中断的问题,初步查看是发现MQ没有继续发送消息同步数据了。随着排查深入发现是K8S的pod节点内存不够导致的驱逐pod,canal-server被重启,canal-client和server断开连接,消费线程遇到异常没有进行合适的处理,打了错误日志退出消亡。学习了canal原理,伪装成slave节点向master拉取binlog并转化为自定义的DML event给用户消费。还学习了canal通过zookeeper的强CA机制实现多节点的HA机制。原创 2024-09-17 15:04:10 · 1214 阅读 · 0 评论 -
MySQL优化实战 解决CPU100%
深入排查并优化数据库CPU周期性打满问题的经历。问题表象为每小时整点03分数据库CPU使用率飙升,持续一分钟后恢复正常。首先排除了业务流量暴增的可能性,聚焦于定时任务。通过详细分析,发现任务状态修改的Job中,通过临时方案解决了问题,并讨论了进一步的优化空间。本文揭示了慢SQL对数据库性能的影响,以及如何通过日志分析和索引优化来解决问题。原创 2024-10-02 12:38:02 · 1045 阅读 · 0 评论