数仓模型设计有几种?分别是什么?大数据企业级实战-13天玩转千亿级数仓项目免费学!

数仓模型设计有几种?好的数仓项目应看架构以及所用到的模型,维度建模是专门应用于分析型数据库、数据仓库、数据集市建模的方法。数据集市可以理解为是一种小型数据仓库。

数仓模型设计

维度模型是数据仓库工程领域最流行的数仓建模经典。维度建模以分析决策的需求出发构建模型,构建的数据模型为分析需求服务,因此它重点解决用户如何更快速完成分析需求,同时还有较好的大规模复杂查询的响应性能。

维度表示要对数据进行分析时所用的一个量,比如你要分析产品销售情况, 你可以选择按类别进行分析,或按区域分析。这样的按..分析就构成一个维度。上图中的用户表、商家表、时间表这些都属于维度表。这些表都有一个唯一的主键,然后在表中存放了详细的数据信息。

事实表发生在现实世界中的操作型事件,其所产生的可度量数值,存储在事实表中。从最低的粒度级别来看,事实表行对应一个度量事件,反之亦然。
数据仓库中不需要严格遵守规范化设计原则。因为数据仓库的主导功能就是面向分析,以查询为主,不涉及数据更新操作。事实表的设计是以能够正确记录历史信息为准则。维度表的设计是以能够以合适的角度来聚合主题内容为准则。

数仓模型设计维度建模三种模式:

1、 星型模型

星形模式(Star Schema)是最常用的维度建模方式。星型模式是以事实表为中心,所有的维度表直接连接在事实表上,像星星一样。
星形模式的维度建模由一个事实表和一组维表成,特点:维表只和事实表关联,维表之间没有关联;每个维表主键为单列,且该主键放置在事实表中,作为两边连接的外键;以事实表为核心,维度表围绕核心呈星形分布

2、雪花模式

雪花模式是对星形模式的扩展。雪花模式的维度表可以拥有其他维度表的,虽然这种模型相比星型更规范一些,但是由于这种模型不太容易理解,维护成本比较高,而且性能方面需要关联多层维表,性能也比星型模型要低。所以一般不是很常用。

3 、星座模式

星座模式是星型模式延伸而来,星型模式是基于一张事实表的,而星座模式是基于多张事实表的,而且共享维度信息。前面介绍的两种维度建模方法都是多维表对应单事实表,但在很多时候维度空间内的事实表不止一个,而一个维表也可能被多个事实表用到。在业务发展后期,绝大部分维度建模都采用的是星座模式。

推荐学习:大数据企业级实战 13天玩转千亿级数仓项目
http://yun.itheima.com/course/823.html?2010stt

基础课程主讲内容包括:

阶段一:千亿级实时数仓项目总体介绍

1. 数据仓库在企业里面的重要性

2. 千亿级实时数仓的项目演示

 

阶段二: 数据建模的应用

1. 为什么要数据建模

2. 维度和指标的概念

3. 指标和维度建模案例

 

 

阶段三. 数据仓库从0到1的过程

1. 数仓典型分层思想(ODS、DWB、DWS、DM、ADS)

2. 数仓建设0到1的过程实战

3. 企业级数据仓库设计的规范

 

阶段四:基于Kylin的OLAP分析

1. Kylin自带的example案例介绍

2. Kylin的Cube创建

3. Kylin的数据膨胀介绍

 

阶段五:需求分析与项目设计

1. 需求分析

2. canal搭建

3. canal数据写入kafka

阶段六:订单与销售额指标计算

1. 销售额指标体系介绍

2. flink实时消费Kafka订单数主题数据

3. 订单金额指标统计

阶段七:行为指标计算

1. 模拟通过埋点方式采集行为数据

2. 使用Flink Streaming计算用户行为相关指标

3. Flink CEP实现转化率分析

阶段八: Druid的安装和使用

1. Druid实时数据摄入

2. Druid基于JSON查询语法

3. Imply Pivot可视化数据分析

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值