- 博客(2)
- 收藏
- 关注
原创 Hadoop生态系统官网下载地址
Hadoop生态系统官网下载地址 Apache版本 Hadoop官网:http://hadoop.apache.org/ Hadoop下载:http://mirror.bit.edu.cn/apache/hadoop/common/ Hadoop历史版本下载:http://archive.apache.org/dist/hadoop/core/ Hadoop文档:http://hadoop.apache.org/docs/ Hive官网:http://hive.apache.org/ Hive下载:http
2020-05-21 17:21:11
652
原创 #数仓架构分析
数仓基础架构 一.逻辑分析 ODS(存储层) DWD(明细层) DWS(聚合层) ADS(应用层) 技术选型:数仓一般以hadoop生态圈为主,离线以hive为核心;准实时以spark为核心; 实时以flink为核心 二.数据调研 ①业务调研:概念模块(cdm) 逻辑模型(ldm) 物理模型(pdm) ②需求调研:报表需求,统计需求,用户画像,推荐系统 ③数据库调研:了解数据库表数据结构,数据形态,全局把握业务流程数据流向,做到真正 的业务流程和数据结构结合 三.主题划分 选择业务过
2020-05-14 17:13:53
348
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人