一次C10K场景下的线上Dubbo问题排查及优化转

最新推荐文章于 2023-03-13 16:40:57 发布

十一技术斩

最新推荐文章于 2023-03-13 16:40:57 发布

阅读量238

点赞数 1

文章标签： java 微服务 rpc 分布式实战经验

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/uuqaz/article/details/125163592

版权

本文介绍了在C10K场景下，基于Dubbo的分布式服务遇到交易失败的问题，分析了由于心跳机制和全连接队列容量不足导致的超时原因。提出了优化心跳处理、增加netty worker线程数、扩大全连接队列长度等解决方案，并展示了优化后的性能提升，确保了线上服务的稳定性和效率。

摘要由CSDN通过智能技术生成

导语

Dubbo 是一款轻量级的开源 Java 服务框架，是众多企业在建设分布式服务架构时的首选。中国工商银行自 2014 年开始探索分布式架构转型工作，基于开源 Dubbo 自主研发了分布式服务平台。

Dubbo 框架在提供方消费方数量较小的服务规模下，运行稳定、性能良好。随着银行业务线上化、多样化、智能化的需求越来越旺盛，在可预见的未来，会出现一个提供方为数千个、甚至上万个消费方提供服务的场景。

在如此高负载量下，若服务端程序设计不够良好，网络服务在处理数以万计的客户端连接时、可能会出现效率低下甚至完全瘫痪的情况，即为 C10K 问题。那么，基于 Dubbo 的分布式服务平台能否应对复杂的 C10K 场景？为此，我们搭建了大规模连接环境、模拟服务调用进行了一系列探索和验证。

正文

C10K 场景下 Dubbo 服务调用出现大量交易失败

1、准备环境

使用 Dubbo2.5.9（默认 netty 版本为 3.2.5.Final）版本编写服务提供方和对应的服务消费方。提供方服务方法中无实际业务逻辑、仅 sleep 100ms；消费方侧配置服务超时时间为 5s，每个消费方启动后每分钟调用1次服务。

准备 1 台 8C16G 服务器以容器化方式部署一个服务提供方，准备数百台 8C16G 服务器以容器化方式部署 7000 个服务消费方。

启动 Dubbo 监控中心，以监控服务调用情况。

2、定制验证场景，观察验证结果

验证情况不尽如人意。C10K 场景下 Dubbo 服务调用存在超时失败的情况。

如果分布式服务调用耗时长，从服务消费方到服务提供方全链路节点都会长时间占用线程池资源，增加了额外的性能损耗。而当服务调用并发突增时，很容易造成全链路节点堵塞，从而影响其他服务的调用，并进一步造成整个服务集群性能下降甚至整体不可用，导致发生雪崩。服务调用超时问题不可忽视。因此，针对该 C10K 场景下 Dubbo 服务调用超时失败情况我们进行了详细分析。

C10K场景问题分析

根据服务调用交易链路，我们首先怀疑交易超时是因为提供方或消费方自身进程卡顿或网络存在延迟导致的。

因此，我们在存在交易失败的提供方、消费方服务器上开启进程 gc 日志，多次打印进程 jstack，并在宿主机进行网络抓包。

1、观察 gc 日志、jstack

提供方、消费方进程 gc 时长、gc 间隔、内存使用情况、线程堆栈等无明显异常，暂时排除 gc 触发 stop the world 导致超时、或线程设计不当导致阻塞而超时等猜想

最低0.47元/天解锁文章

十一技术斩

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

十一技术斩 CSDN认证博客专家 CSDN认证企业博客

码龄3年

487: 原创

3万+: 周排名

226万+: 总排名

117万+: 访问

: 等级

1万+: 积分

4524: 粉丝

3995: 获赞

396: 评论

1万+: 收藏

私信

关注

热门文章

最新评论

记录一次mysql update导致锁表问题
这Leslie_Lau: 逆天，我写的原文直接被你转载了，还开vip 原文在这里，各位也可以看文章的创建时间：https://here-leslie-lau.github.io/post/mysql/update_lock_table/
Java面试题大全、题+详细解答（2022版）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272
RocketMQ保姆级教程
JavaMastergjh: 你好，请问为什么配了一个brokerIp1还要配一个brokerIp2呢
Java高级面试题整理（附答案）
天蓝999: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272
40道JAVA经典算法面试题（答案）
飞羽疾驰: 可以的，我看的另一篇，我面试时90%以上的题目在下边这个博客里：https://knife.blog.csdn.net/article/details/121219272

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。