文章目录
【Flink实时数仓】 实时数据仓库项目实战
项目参考:
https://www.bilibili.com/video/BV1TG411a7nL/?spm_id_from=333.999.0.0&vd_source=fadf978240b1a472cdb682395c8ca5da
配置选择
服务器准备:需要分别安装hadoop102、hadoop103、hadoop104三台主机。
这里我们选择搭建虚拟机来模拟三台主机集群。
物理机配置: 选择了CPU D-1581(16核32线程) + 64 G 内存 的组合。

虚拟机:暂定每台虚拟机 8个处理器 ,16G内存,30G硬盘空间。(之后不够再加)

数据采集工具选择
模拟数据采集模块:
-------------------------1.用户行为数据采集模块
-------------------------2.业务数据采集模块

本文介绍了使用Flink构建实时数据仓库的实战项目,包括配置选择、数据采集工具(如Flume、Kafka、MySQL、Maxwell)和实时数仓工具(Flink、HBase、Kafka、ClickHouse)。详细讲解了实时数仓的分层结构,如ODS、DIM、DWD、DWS和ADS,并探讨了服务器和虚拟机的配置需求。
最低0.47元/天 解锁文章
7540

被折叠的 条评论
为什么被折叠?



