一次关于ETCD客户端(ETCD4J)问题的定位

问题现象

ETCD作为我们管理面(基于Java)的异步任务同步媒介,在管理面压力测试时,发现任务状态不更新了。

问题定位流程

而业务线程日志正常(INFO级别),数据库没有死锁,并且top -c命令和sar命令等查看CPU,内存,硬盘IO都正常。
于是,利用jstack定时十秒打印线程方法调用栈,打印六次。
发现定时线程方法栈很奇怪:
这里写图片描述
发现这个线程池里面的所有线程都处于WAITING状态,并且调用栈一直在加深,和死循环似的,在EtcdResponsePromise.get()这个方法纠结(看上去是个异步get请求)。
将日志级别设为Debug级别,复现场景。

这里写图片描述

从日志中看出,这个通过 HTTP PUT到ETCD的请求一直失败,并且一直重试,查阅资料得知,我去,ETCD4J的默认配置是无限重试(参考资料: https://github.com/jurmous/etcd4j/issues/31
那么,为何会PUT失败呢?

PUT会失败,推测三个原因:

  1. ETCD挂了
  2. 这个路径在PUT过程中被删掉了
  3. ETCD4J请求限制(ETCD4J基于Netty,Netty的Client默认有超时时间和请求大小限制),包括超时时间限制和大小限制

排除了1,2,我推测原因是3

查看ETCD4J官网:
https://github.com/jurmous/etcd4j#custom-parameters-on-etcdnettyclient
这里写图片描述
的确有限制(默认100K),再看我们的路径目前存储的数据大小推测我们的请求大小,嗯,的确快大于了100K

解决方案

  1. 调整ETCD4J配置,参考业界配置和我们的应用场景,配置超时时间为1S,大小为1MB,参考:https://coreos.com/etcd/docs/latest/dev-guide/limit.html
  2. 调整重试次数,不能无限重试,无限重试的结果就是一个错误导致线程池任务队列满了无法响应处理其他正常的状态业务,雪崩。而且这个重试最好不要立刻重试n次,而是以幂函数的时间间隔重试(1S后重试一次,2S后重试一次,4S后重试一次。。。),减轻组件错误带来的某一个压力尖峰时刻
etcd是一个分布式键值存储系统,它提供了一个可靠的方式来存储和检索数据,常用于构建分布式系统。要使用etcd的C++客户端,需要使用etcd的API来进行通信。 在C++中,可以使用Etcd-CPP这个开源库来实现etcd客户端功能。Etcd-CPP是基于gRPC和Protocol Buffers开发的,它提供了一组简单易用的API来与etcd进行交互。 要使用Etcd-CPP,首先需要安装gRPC和Protocol Buffers的开发库。然后,可以通过以下步骤来集成Etcd-CPP到你的项目中: 1. 在你的项目中添加Etcd-CPP的依赖,可以通过CMake或手动添加源代码的方式引入。 2. 创建Etcd客户端对象,使用etcd::Client类。你需要指定etcd服务器的地址和端口。 3. 调用Client对象提供的方法来与etcd进行交互,例如设置键值对、获取键值对、监视键等操作。 下面是一个简单的示例代码,展示了如何使用Etcd-CPP进行基本的操作: ```cpp #include <iostream> #include <etcd/Client.hpp> int main() { etcd::Client client("localhost:2379"); // 设置键值对 client.set("key", "value"); // 获取键值对 auto response = client.get("key"); if (response.is_ok()) { std::cout << "Value: " << response.value().as_string() << std::endl; } // 监视键 client.watch("key", [](const etcd::Response& response) { if (response.is_ok()) { std::cout << "Key updated: " << response.value().as_string() << std::endl; } }); // 等待键的变化 std::cin.get(); return 0; } ``` 这只是一个简单的示例,Etcd-CPP还提供了更多的功能和API,你可以根据自己的需求进行扩展和使用。希望对你有帮助!
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值