Dubbo之connet timeout问题排查

一 背景 
    购物车依赖推荐的dubbo接口,推荐服务每天凌晨3点会批量下线推荐dubbo服务,全量更新商品,更新完以后在执行上线操作,每天凌晨3点10分左右,购物车工程都会出现5000左右的connection timeout error。正常依赖的dubbo服务工程在启动的时候,消费端会经常出现connection timeout error。 

 

二 问题排查 
    遇到问题之后,sa,中间件开发,推荐开发,购物车开发等拉群排查问题,分析影响面。 
    dubbo源码分析 

总结:推荐服务上线之后,消费端收到zookeeper通知,会主动拉取推荐dubbo服务的URL信息。消费端拿到URL信息后,如果connections不配置,则共享连接,否则每服务每连接,然后将该服务URL和clinets列表封装成一个DubboInvoker对象。如果connection timeout下次会重试。 

   哨兵监控分析 

   

我们发现在connection timeout error出现的时候,推荐服务器TcpExtListenOverflows,TcpExtListenDrops指标异常。 

 

 TcpExtListenDrops(监听队列连接丢弃数)和 TcpExtListenOverflows(监听队列连接溢出数): 

  • ListenOverflows:3次握手之后进入Accept Queue,如果Accept Queue满了,队列溢出连接就会丢弃,TcpExtListenOverflows值增加1;
  • ListenDrops:包含上面的情况,也就是说当出现ListenOverflows时,它也会增加1;除此之外,当内存不够无法为新的连接分配socket相关的数据结构时,也会增加1,当然还有别的异常情况下会增加1。

    Accept Queue 的队列长度是由程序的backlog和系统参数net.core.somaxconn共同设置,当backlog的值大于系统设置的net.core.somaxconn时则取net.core.somaxconn的值,否则取程序设置的backlog值。 

总结:net.core.somaxconn默认值是128,dubbo backlog目前1024, min(net.core.somaxconn, backlog) = 128。推荐一个服务的提供者的消费者就由1600多,推荐服务一上线,消费者都是第一时间去建立连接,导致Accept Queue溢出。 
参考:SYN packet handling in the wild 

三 解决问题 
    问题已经分析完成,解决的思路: 

  1. 增加云主机net.core.somaxconn值和dubbo backlog值。
  2. 修改dubbo源码,服务提供者一上线,消费者延迟随机时间之后去建立连接。


    目前所有云主机同步参数net.core.somaxconn调整到2048,dubbo backlog默认值还是1024,需要压测确定具体值,connection timeout error已经由原先的6000降低到200,connection timeout之后会重试连接,不会影响业务功能。

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Dubbo连接超时问题通常是由于网络延迟、服务提供者负载过高或者配置错误等多种原因引起的。下面是排查Dubbo连接超时问题的一些常见方法和建议: 1. 检查网络延迟:首先,可以尝试通过ping命令来检查与服务提供者之间的网络延迟情况。如果延迟较高,可能需要优化网络环境或者切换到更稳定的网络连接。 2. 服务提供者负载过高:可以查看服务提供者的系统资源使用情况,例如 CPU、内存、磁盘等是否过载。如果负载过高,可以优化代码、增加服务器资源或者增加服务实例数等来提高性能。 3. 超时配置错误:可以检查Dubbo的超时配置是否正确。例如,可以确认是否设置了正确的连接超时时间、读写超时时间等,以及是否合理地设置了重试次数等参数。 4. 服务提供者响应时间过长:可以对服务提供者进行性能分析,找出响应时间较长的接口或者方法,并优化其实现。如果有必要,可以采用异步用方式来提高吞吐量和响应速度。 5. 检查服务用链路:可以通过监控工具或者日志来查看服务用链路,找出是否存在用关系错乱、环路或者循环依赖等问题。这些问题可能导致连接超时或者请求被阻塞。 6. Dubbo配置参数:可以尝试Dubbo的相关配置参数,如线程池大小、队列大小、IO线程数等,以适应当前的应用场景。 总之,解决Dubbo连接超时问题的关键是要深入分析问题背后的原因,并针对性地采取相应的优化措施。在排查问题过程中,可以结合相关的监控工具、日志和性能测试工具来帮助定位和解决问题
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值