逻辑建模涉及到整个数据仓库所有层次的模型设计,从DW到DM甚至到了OLAP。重点的设计是在DW和DM层
逻辑模型是对概念模型进行具体的设计,实体的属性,主键,外键等等,主要是将领域模型的概念实体以及实体之间的关系进行数据库层次的逻辑化
逻辑建模主要工作:
1.分析主题域
确定要装载到仓库的主题名称,各自主题的码键和属性组;主题内的实体,及其容量和更新频率;实体的列的属性等
2.粒度模型的设计
粗略估算数据量确定粒度层次的划分,是单一粒度还是多重粒度(比如1年内的数据是天粒度的,历史记录是月粒度的)
3.数据分割设计
针对某一实体的数据应该是按怎样的方式来分割,一般是按照时间来分割,比如每天的数据放在一个分区里面
4.元数据模型的建立
在各种转换和汇总的过程中建立好元数据模型能更好的维护和理解数据
逻辑建模原则:
1> 粒度性:
数据仓库不同的层次具有的粒度是不同的,DW层的数据是原子粒度的数据,比如交易数据原子粒度是订单,记录包括购买的用户及商家,DM层的数据是面向主题按一定的维度进行汇总的数据,如商户集市计算当天出售的订单量
2> 共享性:
在数据仓库中,通过抽象和集成,把一些(维度)信息汇总,做全局的一致化,在整个数据仓库中处于共享状态,任何用户都可以来使用。比如一致性维度
3> 历史性:
针对业务分析的需求,需要从历史信息中获取有用的信息,比如评估客户生命周期价值
4> 一致性:
在设计过程中保持一个统一的业务定义。如渠道的定义、团体的分类等,在整个企业内部保持一致。将来各种分析应用都使用同样的数据,这些数据应按照预先约定的规则进行刷新,保证同步和一致
5> 扩展性:
当有新的需要和改变的时候,逻辑数据模型结构要能够做到可扩展,并能使得对用户透明