基本需求
数据仓库的目的就是能够让用户方便地访问大量数据。
允许用户查询和分析其中的业务信息。
要求数据仓库是安全的、可访问的、自动化的。
安全性
适当的授权机制
- 对于用户数据是只读的
- 划分数据安全等级,公开、机密、秘密、绝密
- 制定访问控制方案,那些用户访问哪些数据
- 设计授予、回收、变更用户范文权限方法
- 添加对数据访问的审计功能。
可访问性
指的是用户访问和检索数据的能力
数据仓库最终用户通常是业务人员、管理人员、数据分析师
他们对组织内的相关业务非常熟悉,对数据理解也很透彻,但不是IT专家。
尽量友好和简单,使得没有技术背景的用户可以轻易查询到他们需要的数据。
自动化
狭义和广义
狭义指的是数据仓库相关作业自动执行。
广义指的是保证数据质量和一致性的前提下,加速数据仓库系统的开发周期的过程。
整个数据仓库生命周期自动化,从对源系统分析到ETL到数据仓库建立、测试、文档化、可以帮助加快产品化进程。降低开发和管理成本。
数据需求
满足数据仓库的数据,确保数据准确性、时效性、和历史可追溯性的需求。
准确性
要想数据仓库实施成功,业务用户必须信任其中数据。
ETL过程总之数据仓库的某个地方保留一份原始数据的复制。
时效性
数据仓库作为分析系统,一般以一天作为时间粒度比较常见。
历史可追溯性
能够辅助随时间变化的趋势分析。帮助理解业务事件与经营绩效之间的关系。