快手亿级Kafka集群应用实践与技术演进之路

快手的Kafka系统处理海量消息,达到数万亿级别,峰值超1亿/s。面对高可用性、可维护性的需求,他们经历了多阶段技术演进,包括多集群建设、平滑扩容、Mirror集群化、资源隔离和消费者智能限速等,显著提升了系统稳定性和运维效率。
摘要由CSDN通过智能技术生成

60c9c3be89d70c1351bf047080596380.png

Kafka 系统在快手有着很广泛的应用,随着其业务的高速发展, Kafka 集群的规模也成指数增长,目前快手 Kafka 集群日消息处理总量达数万亿级别,峰值超过 1 亿 /s。与此同时,快手也面临了很多新问题与技术挑战。本文整理自快手高级架构师、大数据架构团队负责人赵健博在  QCon 北京2019 上的演讲,他介绍了 Kafka 系统在快手的应用实践、遇到的问题以及相应的技术的演进过程。

业务场景

先来看业务场景,在快手,Kafka 被大规模使用着。从场景上看,我们把 Kafka 分成了 3 类集群。第一类,在线集群,Kafka 作为消息中间件,为不同在线业务之间提供异步消息通知服务;第二类,LOG 集群,业务程序直接将 LOG 打给 Kafka,并通过 Kafka 进行传输与收集,由于数据不落地,所以这个过程不能出现由于 Kafka 问题导致业务程序受到影响,这对 Kafka 可用性要求很高,另外,LOG 集群还为重要的实时计算或者模型训练提供数据源;第三类,离线集群,LOG 数据最终的汇聚点,数据会被实时 dump 到 HDFS 中,这部分数据用于离线处理。类似的,离线集群还为次要的实时计算、实时训练提供数据源。

技术演进

第一个阶段:为了支持业务的快速发展,我们首先做了多集群建设以及增加了 Kafka 平滑扩容功能;

第二个阶段,为了保障业务稳定,我们对 Kafka 的可用性进行了改造,经过改造,我们将由于单点宕机发现与恢复的时间从 91s 优化到 6s 左右,有 15 倍的提升;

第三个阶段,为了增加系统的可维护性以及提升读系统的运维效率,我们对数据 Mirror 服务做了集群化建设并开发了资源管理平台;

第四个阶段,为了进一步提升 Kafka 的稳定性、性能,我们做了资源隔离、对 cache 进行了改造、并针对消费者进行了智能限速等。

2019 年,技术迭代还在继续。接下来,我将会介绍其中 5 点的细节:平滑扩容、Mirror 集群化、资源隔离、cache 改造、消费智能限速。

8dcc9fa9cf6b2021e40ef41cda4a4530.png

7e8fd1995641336092ba579c6edb0939.png

210fb5a640b3f32dc9d707fa7b417d4d.png

1e0dde37740e2c19d8b9b19693f584a7.png

6064a8bc4552add62adc8d14fd5b8bd7.png

ca59c27615da329387fc7670aea07a71.png

aae686cee81f730a87dafdaa88d7183f.png

47d5a244bd870c5ba7d4e5726f4f02ba.png

6e58da8b39abab54d0332b056553b481.png

fdde59fdfeda8f60d7622cd0e997ad85.png

0590f69bd07194ba968314418bd29a4f.png

2dc4688bd166ce16a26a88839b4b0102.png

5b924cd23880951828457df16f8152c5.png

4ebfa083f80e0bf181bb6e8712a04320.png

ba7baa304b2e0a8e906529b37a12f79b.png

4f43143128473716597729072b2239f0.png

a65bfe0e5c3ede0a0f7473243c538a87.png

85edeab1d12edf9c9b83cc349cb8b808.png

5779defd27a429836b55afed08295a23.png

5f3f3a7468ec55cffda7213a58279de0.png

061a8962a6b5bd24ff61e1206a09b89a.png

6e935d13d2a51a285a2982692481b129.png

cc7ac32e82ad801d256be5da6d73a23e.png

a3b733a0ff4fdbc70b68d04b278cd153.png

0b13bc8dba58a1951e2241d979b90596.png

9774b3d366136619f5b2adb20defa301.png

14808bf1cdee6a4a937e233a0530042b.png

08ded3667e41c22191a81cdfe4362ac3.png

1317dbea7937e7814a28fa81bf2d43a2.png

d9c11829571a7fdda80efcbd63ca9906.png

ecd19a1093e7ed7dbb13cbc2be9b5d8d.png

3e2c3214fb66c764e1a9232ac0ac8d31.png

2b99914d0b97c3bb0f9c6a4c5f295b24.png

e8a24c0f9efaa806ef42f3d55898bbde.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值