数据仓库必备要求:
- 使数据信息容易存取与展示,以便支持企业决策。
- 数据仓库必须一致展示信息,做到完整可信一致。
- 数据仓库必须是数据信息的安全堡垒,管控信息访问。
- 数据仓库必须易于使用与维护,客户很快融入使用。
维度建模:
按照事实表,维度表来构建数据仓库,数据集市。这种方法的最被人广泛知晓的名字就是星型模式(Star-schema)
维度建模的四个步骤:
- 确定业务核心,解决最核心要解决的业务处理。
- 定义数据粒度,尽量保持数据的原子性,属性不可再分割。
- 确定数据维度,从业务各种需求、统计角度进行处理,也应与数据粒度一致。
- 确定事实表,确定哪些事实展现在事实表中。
退化维度:
事实表中的外键都对应一个维表,维的信息主要存放在维表中;但是退化维仅仅是事实表中的一列,这个维的相关信息都在这一列中,没有维表与之相关联。比如:发票号,序列号等等。
如发票号: 2014042304562234324
2014 04 23 045622 34324(切片)
年 月 日 分钟 自增序列 (Groupby year/month,得出按年/月签的合同)