文刀小桂-CSDN博客

ClickHouse 运行时会将一些个自身的运行状态记录到众多系统表中（system.*所以对于 ClickHouse 自身的一些运行指标的监控数据，也主要来自这些系统表。直接查询这些系统表进行监控会有一些不足之处：这种方式太过底层，监控结果不够直观，还需要在此之上实现可视化展示系统表只记录了 ClickHouse 自身的运行指标，有些时候还需要外部系统的指标进行关联分析，例如 ZooKeeper、服务器 CPU、IO 等。

2024-06-26 12:34:18 964

原创详解 ClickHouse 的 MaterializeMySQL 引擎

ClickHouse 20.8.2.3 版本新增加了 MaterializeMySQL 的 database 引擎，该 database 能映射到 MySQL 中的某个 database ，并自动在 ClickHouse 中创建对应的 ReplacingMergeTree。ClickHouse 服务做为 MySQL 的副本，读取 Binlog 并执行 DDL 和 DML 请求，实现了基于 MySQL Binlog 机制的业务数据库实时同步功能。

2024-06-25 19:29:43 1555

原创详解 ClickHouse 的物化视图

普通视图不保存数据，保存的仅仅是查询语句，查询的时候还是从原表读取数据，可以将普通视图理解为是个子查询物化视图则是把查询的结果根据相应的引擎存入到了磁盘或内存中，对数据重新进行了组织，可以理解物化视图是完全的一张新表。

2024-06-25 12:33:06 1091

原创详解 ClickHouse 的数据一致性

ClickHouse 的 ReplacingMergeTree 等引擎只能保证数据的最终一致性，在查询时可能会出现短暂数据不一致的情况(有些企业业务为了性能可以容忍一些小的不一致)

2024-06-24 23:34:52 610

原创详解 ClickHouse 的查询优化

如果不加 GLOBAL 关键字的话，每个节点都会单独发起一次对右表的查询，而右表又是分布式表，就导致右表一共会被查询 N²次（N是该分布式表的分片数量），这就是查询放大，会带来很大开销。ClickHouse 的 join 是将右表(无论 left join、right join 还是 inner join)的数据全部加载到内存(可能 OOM)，然后左表的每一条数据都去内存中查询能否匹配。将一些需要关联分析的业务创建成字典表进行 join 操作，前提是字典表不宜太大，因为字典表会常驻内存。

2024-06-24 12:26:55 1985

原创详解 ClickHouse 的语法优化规则

ClickHouse 的 SQL 优化规则是基于 RBO(Rule Based Optimization)

2024-06-23 17:17:17 922

原创详解 ClickHouse 的建表优化

ClickHouse 不支持设置多数据目录，为了提升数据 io 性能，可以挂载虚拟券组，一个券组绑定多块物理磁盘提升读写性能，多数据查询场景 SSD 会比普通机械硬盘快 2-3 倍。users.xml 配置项：https://clickhouse.tech/docs/en/operations/settings/settings/ClickHouse 中建表时日期、时间字段最好设置成对应的 Date 、Datetime 类型，避免后续需要经过函数转换处理，执行效率高、可读性好。查看 pipeline。

2024-06-23 11:40:22 1440

空空如也

空空如也