在实时数仓中,一般会使用 Kafka 作为 ODS 层、DWD 层的存储引擎
1、将原始日志数据直接发送到 kafka 消息队列中,作为 ODS 层
2、Flink 从 Kafka (ODS 层)中读取数据,对数据进行过滤,去重,补全空值等操作之后,再写到 Kafka 中,此时的 Kafka 作为 DWD 层。
3、Flink 继续从 Kafka (DWD 层)中读取数据,此时需要与维表(DIM层)进行聚合操作,统计一些指标,得到一张大宽表字段,将其存储到 ClickHouse (DWS 层)