数据仓库简明概念-表类型、建模、建设步骤、分析场景

数仓的概念:
******DW表的类型******
实体表:用于描述实体特性
事实表:全是数字度量,不包含描述
维度表:用于分析

******DW建模******
业务建模:从企业层面划分业务单元,确定业务单元内的业务流程,确定DW项目目标和阶段。
领域概念建模:抽取关键概念,概念分组,概念细化和关联。
逻辑建模:领域概念实体化并将其数据集成为实体表,概念之间事件作为事件表,确定分析维度作为维度表。根据数据冗余需要选择星型或者雪花型数据模型。
物理建模:写ETL脚本

******DW建设步骤******
数据和业务盘点
DW建模
定义数据源、选择DW存储/查询平台和报表工具、分析和可视化、监控工具
平台容量和性能规划
全量数据ETL和增量数据定时调度

******数据分析业务和DW表的关系******
统计分析:用到维度表+事实表/实体表
整体搜索:用到元数据表(类似show tables)确定单库,再用单库搜索找到具体信息
单库搜索:用到实体表/事实表(类似select xxx from xxx where ...)
算法:用到事实表

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值