大数据学习——Day03(数仓实战案例分析)

数仓建模
  1. 范式建模
  2. 维度建模
    - 星型建模
    - 雪花模型
数仓分层
  • ODS(Operation Data Store) --> 操作性数据
  • DW(Data warehouse)–> 数据仓库
  • DM(DataMart)–> 数据集市
数据转换过程
  1. web data(原始数据)
  2. HDFS_ODS(数据操作层)
  3. HDFS_DWD(数据明细层,AVRO格式存储,MapReduce||hive)——ETL
    - AVRO格式动态扩展能力比较强
  4. HDFS_DWS(数据汇总层)——业务关联
  5. HDFS_ADS(数据应用层,ORC格式存储,hive select统计)——指标统计
    -ORC格式便于查询
  6. MySQL(MySQL中间层)——数据统计
  7. 报表系统
开发实现过程
  1. 非结构化数据转换为结构化数据(MR转换)
  2. hive分层实现(上一部分,数据转换过程)
实际实现流程(统计分析)
  1. 数据聚合,将零散数据统一存储
  2. 数据清洗(对数据字段进行拆分组合,得到自己需要的数据字段)
  3. 逐层实现数据分层
  4. hiveSQL生成数据表
  5. 利用工具生成数据报表
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值