--转自:http://blog.itpub.net/post/14877/198599
数据仓库的分层可以算是数据仓库架构的子话题。在前段时间参与的一次讨论中,笔者发现其中争论的焦点集中在每一层的作用、特点、是否有必要存在等问题。其中,大家虽然一致提到某些相关概念,但各方的理解却并非完全一致。例如对于ODS是什么、维度建模是什么等问题的解读,都是如此。
不妨想想看:数据从分散而异构的数据源中长途跋涉,到最终的报表、仪表盘、OLAP应用等等,让用户看到一致的结果,这是一个过程。记得以前有个矿泉水广告,说要经过N层的过滤才得到了那种水。而数据仓库也一样,从原来乱七八糟的数据到交付到用户手中的“纯净”数据,也需要这样一个过滤过程,需要各种不同的过滤装置。
这个过滤过程,我们可以称之为ETL;而那些过滤装置,就可以看作数据仓库的分层。从目前来看,还没有非常统一的分层方法,其中,Inmon和Kimball是最具代表性的两种分层方法。
Inmon与Kimball
在Inmon提出的CIF(Corporate Information Factory,企业信息工厂)中,他将ODS(Operational Data Store,操作型存储)、EDW(Enterprise Data Warehou
数据仓库分层之辩
最新推荐文章于 2024-07-28 13:00:00 发布
本文探讨了数据仓库的分层架构,主要对比了Inmon的CIF(企业信息工厂)和Kimball的总线架构。Inmon主张ODS、EDW、DM三层结构,强调数据的清洗和一致性;而Kimball侧重于数据集市的整合,通过统一维度实现。文章还讨论了ODS层和DW层的特性以及存在的争议,提出实际应用中应根据项目需求选择合适的分层方法。
摘要由CSDN通过智能技术生成