跟Kafka学技术系列之时间轮

最新推荐文章于 2023-04-19 17:00:01 发布

编码博客控

最新推荐文章于 2023-04-19 17:00:01 发布

阅读量189

点赞数

分类专栏：程序员 JAVA 文章标签： Java kafka 大数据架构师程序员

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_21118431/article/details/105442534

版权

写在前面

kafka是一个分布式消息中间件，其高可用高吞吐的特点是大数据领域首选的消息中间件，Kafka是分布式消息队列的顺序读写文件分段组织串联起来思想的鼻祖，包括RocketMq这些消息队列都是借鉴了Kafka早期的架构和设计思路改造而来，所以在架构设计层面，Kafka有非常多值得借鉴的地方。本文是作者介绍Kafka优秀架构设计文章中的一篇，文中的代码和流程图均是base on 0.10.2.0版本。

引出环形队列和延迟队列

从2个面试题说起，第1个问题，如果一台机器上有10w个定时任务，如何做到高效触发？

具体场景是：

有一个APP实时消息通道系统，对每个用户会维护一个APP到服务器的TCP连接，用来实时收发消息，对这个TCP连接，有这样一个需求：“如果连续30s没有请求包（例如登录，消息，keepalive包），服务端就要将这个用户的状态置为离线”。

其中，单机TCP同时在线量约在10w级别，keepalive请求包较分散大概30s一次，吞吐量约在3000qps。

怎么做？

常用方案使用time定时任务，每秒扫描一次所有连接的集合Map<uid, last_packet_time>，把连接时间（每次有新的请求更新对应连接的连接时间）比当前时间的差值大30s的连接找出来处理。

另一种方案，使用环形队列法：

小桔车服 > 跟Kafka学技术-时间轮 > image2020-1-17_16-20-37.png

三个重要的数据结构：

1）30s超时，就创建一个index从0到30的环形队列（本质是个数组）

2）环上每一个slot是一个Set<uid>，任务集合

3）同时还有一个Map<uid, index>，记录uid落在环上的哪个slot里

这样当有某用户uid有请求包到达时：

1）从Map结构中，查找出这个uid存储在哪一个slot里

2）从这个slot的Set结构中，删除这个uid

3）将uid重新加入到新的slot中，具体是哪一个slot呢 => Current Index指针所指向的上一个slot，因为这个slot，会被timer在30s之后扫描到

4）更新Map，这个uid对应slot的index值

哪些元素会被超时掉呢？

Current Index每秒种移动一个slot，这个slot对应的Set<uid>中所有uid都应该被集体超时！如果最近30s有请求包来到，一定被放到Current Index的前一个slot了，Current Index所在的slot对应Set中所有元素，都是最近30s没有请求包来到的。

所以，当没有超时时，Current Index扫到的每一个slot的Set中应该都没有元素。

两种方案对比：

方案一每次都要轮询所有数据，而方案二使用环形队列只需要轮询这一刻需要过期的数据，如果没有数据过期则没有数据要处理，并且是批量超时，并且由于是环形结构更加节约空间，这很适合高性能场景。

第二个问题：在开发过程中有延迟一定时间

最低0.47元/天解锁文章

编码博客控

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
跟Kafka学技术系列之时间轮

写在前面kafka是一个分布式消息中间件，其高可用高吞吐的特点是大数据领域首选的消息中间件，Kafka是分布式消息队列的顺序读写文件分段组织串联起来思想的鼻祖，包括RocketMq这些消息队列都是借鉴了Kafka早期的架构和设计思路改造而来，所以在架构设计层面，Kafka有非常多值得借鉴的地方。本文是作者介绍Kafka优秀架构设计文章中的一篇，文中的代码和流程图均是base on 0.10.2...
复制链接

扫一扫

专栏目录

编码博客控 CSDN认证博客专家 CSDN认证企业博客

码龄10年

385: 原创

17万+: 周排名

220万+: 总排名

35万+: 访问

: 等级

5596: 积分

289: 粉丝

255: 获赞

258: 评论

903: 收藏

私信

关注

热门文章

分类专栏

最新评论

Spring Cloud和Dubbo的区别及各自的优缺点
熊手拉猫手: 提几个意见： “Spring Cloud 发展得非常快，从开始接触时的相关组件版本为 1.x，到现在将要发布 2.x 系列” 意见：你确定你用过 SpringCloud ？？版本号命名规则是“发布列车” 命名法，何来1.x 2.x ？ -------------------------------- “Spring Cloud 来源于 Spring ，天然支持 Spring Boot ” 意见：与其这样说，不如说来源于 Spring Boot ，受 Spring Boot 支持，而不是支持 Spring Boot 。你确定你用过 Spring Cloud？？
Spring Cloud和Dubbo的区别及各自的优缺点
jqncc: springcloud是一系列组件的集合,他啥也不是创新的,就是拿别人的东西来用而已.它的核心只是springboot是rest接口而已.而dubbo只是一个rpc框架,你拿两个维度的东西整个列表说它啥也没有?? 微服务核心说白了就是rpc调用,其他组件都是附属的功能. 在这块dubbo比只支持http rest的sp高级得不是一点两点.
深入理解 RecyclerView 的缓存机制
chwnpp2: 在hiddenViews中的View除了文中提到的刚要被隐藏紧接着又要恢复出现的场景外，还有哪些情况？我现在遇到了两个崩溃： trying to unhide a view that was not hidden 和 view is not a child, cannot hide android.widget.LinearLayout
腾讯---谈一谈Binder的原理和实现一次拷贝的流程
online_faker: 那为什么不将发送端的用户空间也和内存缓存区建立映射，这样不就可以不用拷贝数据了吗
华为C++开发工程师面试总结整理，面试问题你能答上几个？含答案
Tongqiangmei: 感谢博主分享很有用

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。