ClickHouse Keeper 源码解析

本文详细解析了 ClickHouse Keeper 的源码,对比了 Keeper 与 Zookeeper 的优缺点,包括性能、运维和一致性模型。 Keeper 采用 C++ 开发,提供更高的执行效率,避免了 Zookeeper 的 JVM 痛点和 Znode 数量限制。文章深入探讨了 Keeper 的架构、客户端、线程模型和内部流程,特别强调了 LogStore 和 Snapshot 的实现,以及关键配置的调整。通过对 Keeper 的理解和优化,为 ClickHouse 实现云原生化和未来 MetaServer 设计奠定了基础。
摘要由CSDN通过智能技术生成

作者

范振(花名辰繁),阿里云开源大数据-OLAP 方向负责人  

1

背景   

注:以下代码分析版本为开源版本 ClickHouse v21.8.10.19-lts。类图、顺序图未严格按照 UML 规范;为方便表意,函数名、函数参数等未严格按照原版代码。

HouseKeeper Vs Zookeeper

  • Zookeeper java 开发,有 JVM 痛点,执行效率不如 C++;Znode 数量太多容易出现性能问题,Full GC 比较多。

  • Zookeeper 运维复杂,需要独立部署组件,之前出问题比较多。HouseKeeper 部署形态比较多,可以 standalone 模式和集成模式。

  • Zookeeper ZXID overflow 问题,HouseKeeper 没有该问题。

  • HouseKeeper 读写性能均有提升,支持读写线性一致性,关于一致性的级别参见https://xzhu0027.gitbook.io/blog/misc/index/consistency-models-in-distributed-system。

  • HouseKeeper 代码与 CK 统一,自主闭环可控。未来可扩展能力强,可以基于此做 MetaServer 的设计开发。主流的的 MetaServer 基本都是 Raft+rocksDB 的组合,可以借助该 codebase 进行开发。

Zookeeper Client

  • Zookeeper Client 完全不需要修改,HouseKeeper 完全适配 Zookeeper 的协议。

  • Zookeeper Client 由 CK 自己开发,放弃使用 libZookeeper(是一个bad smell代码库),CK 自己从 TCP 层进行封装遵循 Zookeeper Protocol。

2

架构图   

  • 3种部署模式,推荐第一种 standalone 方式,可以选择小机型 SSD 磁盘,最大程度发挥 Keeper 的性能。

      32b6206debeb6d86a799a03b717c756c.png

      3f90c5754ddaf73a27a777d9942eab7f.png

      1bd365d1395e003f276623479bba1961.png

3

核心流程图梳理   

类图关系

03410ce17698ac8885b0495eb155fc34.png

  • 入口 main 函数,主要做2件事:

    • 初始化 Poco::Net::TCPServer,定义处理请求的 KeeperTCPHandler。

    • 实例化 keeper_storage_dispatcher,并且调用
      KeeperStorageDispatcher➝initialize()。该函数主要作用是以下几个:

      • <
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值