1.数仓优势
提供相关信息进行分析和性能估计,提高行业竞争优势
提高企业生产力。可以快速收集准确描述组织机构的信息
有利于客户联系管理,因为他跨越所有商务、所有部门和市场
可以降低成本。通过可靠的方式进行长期趋势跟踪,发现异常。
2.商务分析框架(4种视图)
建立数仓前需要分析商务需求,搭建商务分析框架。
a.自上向下视图:选取数仓所需信息,包括现在和未来的相关需求
b.数据源视图:被操作的数据库库细通收集、存储和管理信息,如ER图或者case建模工具
c.数据仓库视图:事实表和维表,提供数仓信息包括与计算的总和和计数,以及提供历史背景的关于源、日期和时间等信息
d.商务视图:从用户的角度透视数仓的数据
3.数仓的设计过程和步骤
数据仓库可以使用自顶向下方法、自底向上方法或者二者结合的混合方法设计。
自定向下方法:由总体规划和规划开始
自底向上方法:以实验和原型开始。在商务建模和技术开发的早期阶段,这种方法是有用的。
设计步骤:
a.选取待建模的商务处理:
整个组织的-->数仓模型
处理部门的-->数据集市
b.选取商务处理的粒度
c.选取用于每个事实表记录的维:e.g时间、商品、顾客、供应商、仓库、事务类型等
d.选取将安放在每个事实表记录中的度量;e.g数值量
4.数仓后期管理:
数据刷新
数据源同步
规划灾难恢复
管理存取控制和安全
管理数据增长
管理数据库性能
数仓的增强和扩充
5.数据仓库的进化路径
数据仓库广泛用在银行、金融服务、生活消费品和零售批发部门
最初:用于产生报告和回答预先定义的查询
渐渐:分析汇总和详细数据,(报表和图表形式)
然后:用于决策。进行多维分析和复杂切片、切块操作
最后:数据挖掘工具,用于知识发现战略决策制定