文章目录
【Flink实时数仓】 实时数据仓库项目实战
项目参考:
https://www.bilibili.com/video/BV1TG411a7nL/?spm_id_from=333.999.0.0&vd_source=fadf978240b1a472cdb682395c8ca5da
配置选择
服务器准备:需要分别安装hadoop102、hadoop103、hadoop104三台主机。
这里我们选择搭建虚拟机来模拟三台主机集群。
物理机配置: 选择了CPU D-1581(16核32线程) + 64 G 内存 的组合。
虚拟机:暂定每台虚拟机 8个处理器 ,16G内存,30G硬盘空间。(之后不够再加)
数据采集工具选择
模拟数据采集模块:
-------------------------1.用户行为数据采集模块
-------------------------2.业务数据采集模块