关注下一代数据仓库架构--DW2.0

数据仓库始于20世纪80年代中期。在1990年第一本关于数据仓库的图书出现后,数据集市、ODS、DSS应用等与数据仓库相关的概念开始依次出现。

  在数据仓库概念出现的同时,技术的进步促进了数据仓库的商业化进程。DBMS处理超大量数据的能力逐步增强。存储数据用的磁盘的价格大幅度下降。新的存储介质如磁带等出现。商业智能供应商的出现。数据仓库在短短的几年内就由理论步入了现实应用中。

  然而,随着数据仓库的逐步建立,人们对数据仓库的理解逐步出现了偏差。很多咨询公司正在建立一些不是真正数据仓库的数据仓库。有些供应商在谈 论着建立实时数据仓库,而在他们建立的数据仓库方案中根本没有这一部分。一些面向数据仓库技术的研讨会探讨着事实上并不是数据仓库的数据仓库解决方案。从 那些人对数据仓库表述的概念中可以看出,他们建立的一种简化而无效的数据仓库形式,而事实上并不能称之为数据仓库。

  总结来说,人们对数据仓库的理解正在逐步走向错误。人们正在使用一些过时的数据仓库概念或者与数据仓库很相似但不是真正数据仓库的概念在销售他们的产品和服务,这些人在销售他们产品和服务时不会去考虑他们自己提出的这些概念到底是正确的还是错误的。

  在人们对数据仓库具有着混乱的理解的同时,DW2.0诞生了。

  DW2.0 - the arthitecture of the next generation of data warehousing - 对现代数据仓库进行了简明而又清晰的描述。DW2.0已经被Bill Inmon和Inmon Data Systems注册为商标,未得到允许不能用于商业用途。通过DW2.0,大家可以知道现代的数据仓库到底是什么样子的,不是什么样子的。那些供应商、咨 询商未得到Bill Inmon的书面许可是不可以为了自己的目的而去曲解DW2.0的本意。

  在过去的二十年中,数据仓库的概念一直在逐步的进化中,而DW2.0是对数据仓库概念最现代的理解和描述。

  Bill Inmon的网站包含了DW2.0详细的定义和描述。所有的内部被分为不同的章节。其中的每一个章节都相当于该部分内容的白皮书。在阅读时,大家可以根据自己的需要顺序阅读或者挑选某些章节阅读。

  网站中的DW2.0的内容是为非商业目的读者提供的。对于出于商业目的而需要使用DW2.0的人或企业,可以通过交相应的费用得到许可。

  DW2.0的章节目录如下:

  简介 - 对现代数据仓库的一个整体描述。

  中心数据仓库的区域划分相关章节:

  1.交互区(Interactive Sector) - 数据仓库中对性能要求较高的处理所在的区域,是DW2.0中心数据仓库的一部分

  2.整合区(Integrated Sector) - 数据仓库中整合数据的区域,是DW2.0中心数据仓库的一部分。

  3.近线区(Near Line Sector) - 数据仓库中访问频率较低的数据的保存区域,是DW2.0中心数据仓库的一部分。

  4.归档区(Archival Sector) - 数据仓库中访问频率非常低的数据的保存区域,是DW2.0中心数据仓库的一部分。

  开发相关章节:

  5.DW2.0中的System of Record - DW2.0中维护数据完整性和可信性的数据。

  6.建立DW2.0 - 建立DW2.0的相关技术和方案。

  7.DW2.0建立方法学 - 关于螺旋式开发方法学的讨论。

  8.模型 - 在开发过程中,业务模型和数据模型的角色及作用。

  9.从时间价值来考虑数据 - 考虑到时间的因素,数据应该被如何构建。

  DW2.0内容相关章节:

  10.DW2.0 - DW2.0内容的定义。

  11.DW2.0的联通性 - 描述DW2.0中各部分是如何联系在一起的。

  12.非结构化数据 - 描述DW2.0中的非结构化数据。

  其他组件相关章节:

  13.虚拟操作数据存储(VODS) - 虚拟操作数据存储(The virtual operational data store)相关内容。

  14.探索仓库(Exploration Warehouse) - 为执行大量统计程序方便而建立的一个区域。

  15.ETL - 描述操作数据整合到数据仓库的过程。

  16.数据集市(Data Marts) - 从多维的角度分析数据的一个区域。

  17.粒度管理器(Granularity Manager) - 描述当数据的粒度太低时应该作些什么处理。

  18.元数据(Metadata) - DW2.0中本地元数据和企业元数据的概念。

  其他主题相关章节:

  19.全局数据仓库(Global Data Warehouse) - 当企业需要多个数据仓库时如何来处理。

  20.从多个存储设备(Multiple Storage Media)上访问数据 - 从多个存储设备上访问数据的技术和方案。

  21.性能 - 充分使用数据仓库。

  22.移植 - 从第一代数据仓库移植到第二代数据仓库。

  23.成本判断 - 关于为什么要建立数据仓库的内容,也是企业需要知道的内容。

  更多详细内容,请访问作者BLOG: www.chinabi.net/blog/user1/lastwood/index.html
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值