- 博客(1)
- 收藏
- 关注
原创 数仓项目实战
项目介绍1.项目技术选型:基础设施:hive数据存储平台:hdfs资源调度及监控平台:yarn运算引擎:spark日志采集工具:flume任务调度工具:azkaban元数据管理系统:atlas2分层设计:2.1分层原因数据仓库中的数据表,往往是分层管理、分层计算的;所谓分层,具体来说,就是将大量的数据表按照一定规则和定义来进行逻辑划分;ODS层:操作数据(最原始的数据)层 – 贴源层DWD层:数仓明细层,一般是对ODS层的表按主题进行加工和划分;本层中表记录的还
2020-08-17 19:29:16 2015
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人