dubbo超时机制导致的连接池耗尽处理

场景问题

dubbo超时机制导致的雪崩连接

异常描述

1. 中台Dubbo服务提供者(provider)出现无法获取Dubbo服务处理线程异常
2. 后台出现无法获取数据库连接池的异常
3. 前台响应时间异常飙高
4. 系统处理能力下降,核心基础服务无法提供正常服务

模拟场景

1. dubbo服务DemoService
/**
 * dubboDemoService
 */
public class DemoServiceImpl implements DemoService {

     public String sayHello(String name) {
         System.out.println("[" + newSimpleDateFormat("HH:mm:ss").format(new Date()) + "] Hello " + name + ",request from consumer: " + RpcContext.getContext().getRemoteAddress());
         return "Hello " + name + ", response from provider: " + RpcContext.getContext().getLocalAddress();
     }

 /**
 * DemoServiceprintUUID
 * @param uuid
 * @return
 */
 public String printUUID(String uuid) {
     System.out.println("[" + new SimpleDateFormat("HH:mm:ss").format(new Date()) + "] UUID:" + uuid + ",request from consumer: " + RpcContext.getContext().getRemoteAddress());
     try {
         Thread.sleep(30000); // 睡30s
     } catch (InterruptedException e) {
         e.printStackTrace();
     }
     return "UUID " + uuid + ", response from provider: " + RpcContext.getContext().getLocalAddress();
 }
}

2. 服务提供者用Spring xml配置声明暴露服务

 <beans xmlns="http://www.springframework.org/schema/beans"
 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xmlns:dubbo="http://code.alibabatech.com/schema/dubbo"
 xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-2.5.xsd
 http://code.alibabatech.com/schema/dubbo
http://code.alibabatech.com/schema/dubbo/dubbo.xsd">

 <!-- -->
 <dubbo:application name="hello-world-app" />

 <!-- multicast -->
 <dubbo:registry id="registry1" address="zookeeper://127.0.0.1:2181" />

 <!-- dubbo20880 -->
 <dubbo:protocol name="dubbo" port="20880" />

 <!-- bean -->
 <bean id="demoService"class="com.alibaba.dubbo.demo.provider.DemoServiceImpl" />
 
 <!-- -->
 <dubbo:service interface="com.alibaba.dubbo.demo.DemoService" ref="demoService" group="dubbo-demo" version="1.0.0" />
 
</beans>
3. 服务消费者通过Spring配置引用远程服务
<beans xmlns="http://www.springframework.org/schema/beans"
 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
 xmlns:dubbo="http://code.alibabatech.com/schema/dubbo"
 xsi:schemaLocation="http://www.springframework.org/schema/beans
http://www.springframework.org/schema/beans/spring-beans-2.5.xsd
 http://code.alibabatech.com/schema/dubbo
http://code.alibabatech.com/schema/dubbo/dubbo.xsd">

 <!-- -->
 <dubbo:application name="consumer-of-helloworld-app" />

 <!-- multicast -->
 <dubbo:registry address="zookeeper://127.0.0.1:2181" />

 <!-- beandemoService -->
 <dubbo:reference id="demoService" interface="com.alibaba.dubbo.demo.DemoService" group="dubbo-demo" version="1.0.0" timeout="5000" />
</beans>
4. 服务消费者创建多线程调用100次dubbo服务
public class DemoAction {

     private DemoService demoService;

     public void setDemoService(DemoService demoService) {
         this.demoService = demoService;
     }

     /**
      * 100 DemoService
      * @throws Exception
      */
     public void start() throws Exception {
         for (int i = 0; i < 100; i++) {
             String uuid = java.util.UUID.randomUUID().toString();
             new Thread(new MyRunnable(demoService, uuid),
             String.valueOf(i)).start();
         }
     }
}

    /**
     * DemoService 
     */
    class MyRunnable implements Runnable {

         private DemoService demoService;

         private String uuid;

         public MyRunnable(DemoService demoService, String uuid) {
             this.demoService = demoService;
             this.uuid = uuid;
         }

         public void run() {
             try {
                 String uuid2 = demoService.printUUID(uuid);
                 System.out.println("[" + new SimpleDateFormat("HH:mm:ss").format(new Date()) + "] " + uuid2);
             } catch (Exception e) {
                 e.printStackTrace();
             }
         }
}

模拟结果

1. dubbo服务提供者报错日志分析: dubbo线程池耗尽 ;从日志中我们可以看到线程池的大小为200
问题:我们服务消费者只创建了100个线程调用dubbo服务,为什么会导致线程超过200?

2. dubbo服务消费者报错日志分析:从日志中可以看出调用执行DemoService的printUUID方法超时(timeout默认5000ms)。由于我们 的dubbo重试机制,如果调用一直超时,dubbo框架会默认再创建线程重试调用3次,所以如果没有dubbo线程池的限制以及一直调用服务超时的问题,消费者会一共调用400次,这就解答了问题1中dubbo服务提供者的线程池耗尽的异常了。

问题分析以及解决方案

方案1. 将dubbo的线程池设置为更大值,处理高并发调用服务的问题

方案2. 关闭dubbo消费端重试机制,防止服务调用超时后重试机制导致的耗费dubbo线程池的问题以及后台数据库连接池的耗费。

方案3、也可以同时给服务提供者和消费者的配置中都增加超时时间,出现问题后快速熔断,超时频发时并告警通知到研发人员

  • 9
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Dubbo连接超时问题通常是由于网络延迟、服务提供者负载过高或者配置错误等多种原因引起的。下面是排查Dubbo连接超时问题的一些常见方法和建议: 1. 检查网络延迟:首先,可以尝试通过ping命令来检查与服务提供者之间的网络延迟情况。如果延迟较高,可能需要优化网络环境或者切换到更稳定的网络连接。 2. 服务提供者负载过高:可以查看服务提供者的系统资源使用情况,例如 CPU、内存、磁盘等是否过载。如果负载过高,可以优化代码、增加服务器资源或者增加服务实例数等来提高性能。 3. 超时配置错误:可以检查Dubbo超时配置是否正确。例如,可以确认是否设置了正确的连接超时时间、读写超时时间等,以及是否合理地设置了重试次数等参数。 4. 服务提供者响应时间过长:可以对服务提供者进行性能分析,找出响应时间较长的接口或者方法,并优化其实现。如果有必要,可以采用异步调用方式来提高吞吐量和响应速度。 5. 检查服务调用链路:可以通过监控工具或者日志来查看服务调用链路,找出是否存在调用关系错乱、环路或者循环依赖等问题。这些问题可能导致连接超时或者请求被阻塞。 6. 调整Dubbo配置参数:可以尝试调整Dubbo的相关配置参数,如线程大小、队列大小、IO线程数等,以适应当前的应用场景。 总之,解决Dubbo连接超时问题的关键是要深入分析问题背后的原因,并针对性地采取相应的优化措施。在排查问题过程中,可以结合相关的监控工具、日志和性能测试工具来帮助定位和解决问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值