【Flink实时数仓】数据仓库项目实战 《一》 准备工作

本文介绍了使用Flink构建实时数据仓库的实战项目,包括配置选择、数据采集工具(如Flume、Kafka、MySQL、Maxwell)和实时数仓工具(Flink、HBase、Kafka、ClickHouse)。详细讲解了实时数仓的分层结构,如ODS、DIM、DWD、DWS和ADS,并探讨了服务器和虚拟机的配置需求。
摘要由CSDN通过智能技术生成

【Flink实时数仓】 实时数据仓库项目实战

项目参考:
https://www.bilibili.com/video/BV1TG411a7nL/?spm_id_from=333.999.0.0&vd_source=fadf978240b1a472cdb682395c8ca5da

配置选择

服务器准备:需要分别安装hadoop102、hadoop103、hadoop104三台主机。
这里我们选择搭建虚拟机来模拟三台主机集群。
物理机配置: 选择了CPU D-1581(16核32线程) + 64 G 内存 的组合
在这里插入图片描述

虚拟机:暂定每台虚拟机 8个处理器 ,16G内存,30G硬盘空间。(之后不够再加)
在这里插入图片描述

数据采集工具选择

模拟数据采集模块:
-------------------------1.用户行为数据采集模块
-------------------------2.业务数据采集模块

用户行为数据采集模块 (Flume、Kafka)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值