互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(四)——维度建模基础理论

维度建模基础理论


事实表
事实表保存了大量业务度量数据(即事实)的表。最有用的事实是数字类型、可加类型。
事实表以粒度化分:事务粒度事实表(细)、周期快照粒度事实表、累积快照粒度事实表(粗)。
事实表的粒度决定了数据仓库中数据的详细程度。
事实表中一般只存放数字或标志用来做统计,如数量、收益
事实表举例:维ID,维ID,收益,数量,支出,毛利


维度表
用户分析数据的窗口,包含事实数据表中事实记录的特征(或提供描述性信息,或指定如何汇总有数据以便分析者提供有用信息)
维度表举例:客户ID,客户姓名,年龄,...


粒度grain
数据的详细程度。粒度越细,数据量越大,存储空间大,查询性能慢


层次hierarchy
举例:省-市-县;年-月-日


维度建模三种模型
星形模型:事实表被维度包围,维度表和事实表通过主关键字和外关键字联系在一起,且维度没有被新的表连接。用的最多。
雪花模型:事实表被多个维表或一个或多个层次所包围,一般在处理大的且相对静态的层次时使用。
多维模型


建模一般过程
1. 确实每个事实表粒度
2. 确定维度的属性
3. 确定维度的层次
4. 确定每个事实所需要关联的维度
5. 确定数字型事实,包括预先计算的
6. 确定缓慢变化维





评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值