大数据-数据仓库维度建模

本文介绍了维度建模,主要用于分析型数据库和数据仓库。维度建模包括选择业务过程、声明粒度、确认维度和事实,以及维度表和事实表的设计。接着探讨了维度建模的星形、雪花和星座三种模式,以及它们各自的特点和应用场景。同时,讨论了缓慢变化维度问题的解决方案,并概述了规范化数仓、维度建模数仓和独立数据集市三种数仓建模体系。
摘要由CSDN通过智能技术生成

一、维度建模(dimensional modeling)

是专门用于分析型数据库、数据仓库、数据集市建模的方法。

1. 维度设计的主要流程

(1) 选择业务过程

业务过程是组织完成的操作性活动,业务过程事件建立或获取性能度量,并转换成事实表中的事实。业务过程定义了特定的设计目标以及对粒度、维度、事实的定义。通过对业务需求以及数据源的综合考虑,决定选择哪种业务过程开展建模工作

(2) 声明粒度

粒度用于确定某一事实表中的行表示什么。粒度声明是设计必须履行的合同。在选择维度或事实前必须声明粒度,某个候选维度或事实必须与定义的粒度保持一致。在所有的维度设计中强制实行一致性是保证BI应用性能和易用性的关键。

(3) 确认维度

维度==提供围绕某一业务过程事件所涉及的“谁、什么、何处、何时、为什么、如何”==等背景。

(4) 确认事实

事实涉及来自业务过程事件的度量,基本上以数量值表示。
与之前在操作型数据库中介绍的关系建模方法相比增加两个概念:

1. 维度表(dimension)

表示对分析主题所属类型的描述,通常来说维度表信息比较固定且数据量小。

2. 事实表(fact table)

表示对分析主题的度量,事实表包含了与各维度表相关联的外码,并通过JOIN方式与维度表关联。事实表的度量通常是数值型,

Big Date Overview数据,是比文字出现更早的工具,它帮助人类不断拓展对客观世界的认知,是社会生活中不可缺少的关键要素。身处大数据时代的我们,更加受到数据及其分析模型带来的影响,既有各种生活的便利,情景化的舒爽,也有隐私泄露的不快。为了更好地掌握数据,正确地分析数据,精准地描述规律,我们必须掌握一定的数据分析知识,而本书将是打开这扇门的一把钥匙。执教十年,经历了从数据挖掘到大数据的云卷云舒,一代代的技术更迭,不变的是对数据知识探索的执着初心。但是,咨询者众,待解惑者也不少,一一解答既无效率又没效果,因此在去年萌生了写本书的想法。与理论型书籍不同,本书的方法论是来自传统理论但充分考虑了实战环境而进行了适配性的修订。希望读者在阅读时要注意,因地制宜,*应变,重神不重形,切不可机械照搬。*章讲创新思维。这是因为数据分析的起点就是头脑,是思考,想做好数据分析,打开头脑是*重要的,没有之一。第二章至第八章讲数据分析。从数据本身开始,评述了统计分析、数据挖掘和大数据等分析技术,还介绍了由浅入深的三种主要工具软件的使用技巧,非常适合有一定操作经验但亟须进阶的操作者。第九章至第十六章则聚焦经营分析。经营分析是企业经营*重要的分析工具组合,可能融合了非常复杂的分析技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值