数据仓库要解决什么事情?—发现未发现的,证明推论,支持决策=数据仓库设计原则:
1、数据仓库必须使组织结构数据变得容易存取
2、必须一致的展示组织结构
3、必须具有广泛的适应性和修改
4、必须安全
数据仓库的构建和出版业有很类似的流程。
——-关键构件
数据聚积环节(ETL)
数据展示环节(维度数据库)OLAP
——-基本概念
事实表:最新粒度的基本表,一行对应一个度量值,所有的度量值必须要有相同的粒度
维度
设计维度模型的四步:
1、选取要建模的过程(关键点:建模是以处理为单位的,不是以部门为单位。(简单理解就是只数据仓库构建于订单的全生命周期,不能根据部门进行裁剪,避免后继扩展困难))
===对ec来说,销售的处理是一个建模点
2、定义业务要处理的粒度(就是如何定义事实表的一行?)
===订单行项目?shippinggroup?
3、选取每个事实表行的维度
===如果对粒度很清楚,对于维度一般是很容易确认的
4、确定要对事实表行的度量值的确认(要对什么值进行测量)