ClickHouse架构设计中的核心模块
1、Column 与Filed
Column和Filed是ClickHouse数据最基础的映射单元,作为一款百分之百的列式存储数据库,ClickHouse按列存储数据
2、DataType
DataType负责数据的序列化和反序列化
DataType虽然负责数据的序列化工作,但是不负责数据的直接读取,而是从Column和Filed对象获取
3、Bolck与Block流
ClickHouse内部的数据操作是面向Block对象进行的,并且采用了流的形式。
Block流使用了泛化的设计模式,对数据的各种操作最终都会转化成一种流的实现
IBlockInputStream接口总共有60多个实现类,涵盖了ClickHouse数据摄取的方方面面。
IBlockOutputStream的实现方法有20多种。
4、Table
在数据表的底层设计中并没有所谓的Table对象,直接使用IStorage接口代指数据表
5、Parser 与Interpreter
6、Functions 与Aggrate Functions
7、Cluster 与Replication
Clickhouse的集群由分片(shard)组成每个分片(replica)通过副本组成