数据仓库如何评价数据模型的好坏
一般评价数据模型好坏的指标有以下几点:
1.高内聚和低耦合
(1)将业务相近或者相关、粒度相同的数据设计为一个逻辑或者物理模型
(2)将高概率同时访问的数据放在一起,将低概率同时访问的数据分开存储。
2.核心模型与扩展模型分离
(1)核心模型包括的字段用于支持常用的核心业务。
(2)扩展模型包括的字段支持个性化的或少量的应用的需要。
不能让扩展模型的字段过度侵入核心模型,以免破坏核心模型的架构简介性与可维护性。
3.公共处理逻辑下沉及单一
越是底层公用的处理逻辑越应该在数据调度依赖的底层进行封装与实现,不要让公用的处理逻辑暴漏给应用层实现,不要让公共逻辑多出同时存在。
4.成本与性能平衡
适当的数据冗余可换取查询和刷新性能,不宜过度冗余与数据复制。
5.数据可回滚
处理逻辑不变,在不同时间多次运行数据结果确定不变
6.一致性
具有相同含义的字段在不同表中的命名必须相同。
7.命名清晰、可理解
表命名需清洗、一致,表名需易于消费者理解和使用。