维度建模基础理论
事实表
事实表保存了大量业务度量数据(即事实)的表。最有用的事实是数字类型、可加类型。
事实表以粒度化分:事务粒度事实表(细)、周期快照粒度事实表、累积快照粒度事实表(粗)。
事实表的粒度决定了数据仓库中数据的详细程度。
事实表中一般只存放数字或标志用来做统计,如数量、收益
事实表举例:维ID,维ID,收益,数量,支出,毛利
维度表
用户分析数据的窗口,包含事实数据表中事实记录的特征(或提供描述性信息,或指定如何汇总有数据以便分析者提供有用信息)
维度表举例:客户ID,客户姓名,年龄,...
粒度grain
数据的详细程度。粒度越细,数据量越大,存储空间大,查询性能慢
层次hierarchy
举例:省-市-县;年-月-日
维度建模三种模型
星形模型:事实表被维度包围,维度表和事实表通过主关键字和外关键字联系在一起,且维度没有被新的表连接。用的最多。
雪花模型:事实表被多个维表或一个或多个层次所包围,一般在处理大的且相对静态的层次时使用。
多维模型
建模一般过程
1. 确实每个事实表粒度
2. 确定维度的属性
3. 确定维度的层次
4. 确定每个事实所需要关联的维度
5. 确定数字型事实,包括预先计算的
6. 确定缓慢变化维
事实表
事实表保存了大量业务度量数据(即事实)的表。最有用的事实是数字类型、可加类型。
事实表以粒度化分:事务粒度事实表(细)、周期快照粒度事实表、累积快照粒度事实表(粗)。
事实表的粒度决定了数据仓库中数据的详细程度。
事实表中一般只存放数字或标志用来做统计,如数量、收益
事实表举例:维ID,维ID,收益,数量,支出,毛利
维度表
用户分析数据的窗口,包含事实数据表中事实记录的特征(或提供描述性信息,或指定如何汇总有数据以便分析者提供有用信息)
维度表举例:客户ID,客户姓名,年龄,...
粒度grain
数据的详细程度。粒度越细,数据量越大,存储空间大,查询性能慢
层次hierarchy
举例:省-市-县;年-月-日
维度建模三种模型
星形模型:事实表被维度包围,维度表和事实表通过主关键字和外关键字联系在一起,且维度没有被新的表连接。用的最多。
雪花模型:事实表被多个维表或一个或多个层次所包围,一般在处理大的且相对静态的层次时使用。
多维模型
建模一般过程
1. 确实每个事实表粒度
2. 确定维度的属性
3. 确定维度的层次
4. 确定每个事实所需要关联的维度
5. 确定数字型事实,包括预先计算的
6. 确定缓慢变化维