数据仓库的作用
减少数据冗余,提高信息一致性,让企业能够利用数据做出更优决策的方法,数据仓库是企业数据管理的核心。
业务驱动因素
运营支持职能、合规需求(历史数据响应)和商务智能活动(主因:提供洞察、提升效率、增强竞争优势)
数据仓库建设目标
- 支持商务智能活动;
- 赋能商业分析和高效决策;
- 基于数据洞察寻找创新方法。
数据仓库建设应遵循的原则
- 聚焦业务目标;
- 以终为始;
- 全局性的思考和设计,局部性的行动和建设;
- 总结并持续优化,而不是一开始就这样做;
- 提高透明度和自助服务;
- 与数据仓库一起建立元数据,DW的成功关键是能准确解释数据;
- 协同;
- 不要千篇一律。
活动
- 理解需求;
- 定义和维护DW和BI架构
- 开发数据仓库和数据集市;
- 加载数据仓库;
- 实施BI产品组合;
- 维护数据产品。
商务智能
- 第一层含义,商务智能指的是一种理解组织诉求和寻找机会的数据分析活动。数据分析的结果用来提高组织决策的成功率;
- 第二层含义,商务智能指的是支持这类数据分析活动的技术集合。
数据仓库
一个集成的决策支持数据库和与之相关的用于收集、清理、转换和存储来自各种操作和外部源数据的软件程序。数据集市是数据仓库中数据子集的副本。从广义上讲,数据仓库包括为任何支持商务智能目标的实现提供数据的存储或提供操作。
数据仓库建设
数据仓库中数据的抽取、清洗、转换、控制、加载等操作过程。数据仓库建设流程的重点是通过强制业务规则、维护适当的业务数据关系,在运营的数据上实现一个集成的、历史的业务环境,还包括与元数据资料库交互的流程。传统意义上建设主要关注结构化数据,现在也包含半结构化数据和非结构化数据。
数据仓库建设的方法
Bill Inmon和Ralph Kimball,分别使用范式建模和多维建模来完成数据仓库建模。Bill Inmon定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。Ralph Kimball提出:主张自下而上(DMDW)的方式,力推数据集市建设,他定义“为查询和分析定制的交易数据的副本”。
他们遵循的核心理念相似:
- 数据源于其他系统;
- 以提升数据价值的方式整合数据;
- 便于数据被访问和分析;
- 都为了让授权的利益相关方访问到可靠的、集成的数据;
- 建设的目的涵盖工作流支持、运营管理和预测分析。(源于其他、提升价值、便于分析、确保可靠、使能预测)
企业信息工厂
- 面向主题的
- 整合的
- 随时间变化的
- 稳定的
- 聚合数据和明细数据
- 历史的
企业信息工厂组成
- 应用程序
- 数据暂存区
- 集成和转换
- 操作型数据存储
- 数据集市
- 操作型数据集市
- 数据仓库
- 参考数据、主数据和外部数据
- 运营报告。