《DW2.0下一代数据仓库的构架》研读心得

2008年的时候就看过这本书的介绍,今天借到中文版,可以好好研读一下了。

一、“真正的”数据仓库

        DW2.0中,作者认为数据仓库很快演变为一个被称为企业信息工厂的架构。包括:源系统、ODS、ETL、企业数据仓库、数据集市和探索仓库等组件。这一点基本上还是DW中的观点。现在电子商务应用中基于云计算的数据仓库已经发生了根本变化,可能只需一个云数据仓库,即能满足数据集市、数据挖掘等业务需求,ODS可能会被省略,ETL过程被实时数据流所代替。几乎可无限扩展的存储代替了高昂的专业存储,线性提升的计算代替了复杂昂贵的商用系统。真正的数据仓库的面纱已经打开了!

二、逻辑分层

        DW2.0中提出划分为四个区:交换区、整合区、近线区、归档区。因为云数据仓库的出现,高性能计算和天文级存储不再是高不可攀,这点不再重要,但仍具有参考意义。

三、DW2.0流动性-语义常态和暂态数据

        DW2.0提出数据流动性:语义常态和暂态数据,以此应对业务需求变化和技术架构难以变化的矛盾。云数据仓库中,因为基于列/列族(key/value/stamp)的数据存储和应用,无疑更有优势。这点仍有参考意义和实际意义。

四、DW是应用而非项目

        过去认为DW是一个长期的项目,数据仓库和应用需求可以分离,结果发现应用时根本无法使用。DW2.0中,认为DW是应用,而非项目。由此,数据仓库在规划、设计、建设时需结合应用需求“总体规划、分步实施”,避免数据和应用脱节。

五、数据模型

        DW2.0中提出建立企业数据模型,并完成模型转换。我认为,在云数据仓库中同样需要整合数据模型,汇总模型和明细模型,并近可能使用宽表,提供统一视图。以此,提高数据适用性,提供高性能计算能力。

六、ETL与DW2.0

        在DW2.0中,ETL仍是一个非常重要的工作,但在云数据仓库中,需满足实时的要求,因此ETL被实时数据流所代替。

七、元数据与DW2.0

        元数据在DW中无从提及,在DW2.0中多处提到,但元数据的用途阐述的还不够深入,在实际应用中,需要借助于元数据管理系统实现。

八、数据质量

        数据质量也是在DW2.0中首次提及,在技术上,借助于元数据管理系统可有效管理数据质量问题,管理上,可借助IMO(信心管理组织)来管理数据质量问题。

九、非结构化数据

        针对非结构化数据,DW2.0充分认识到了其重要性,可以用来作为参考,也可以借助于NLP(自然语言处理)、AI(人工智能)等直接进行聚合,提取有价值的信息。

 

        以上,对DW2.0进行些概要的分析,以后在云数据仓库的实践中再进一步完善。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DW2.0是下一代数据仓库构架的概念,它是数据仓库的进化版本。DW2.0构架的目标是通过提供更高级别的数据集成和数据分析能力,帮助企业更好地应对庞杂的数据环境和业务需求。DW2.0构架着重强调数据管理和数据整合,以便更好地支持企业的决策和分析工作。以下是关于DW2.0构架的主要特点和优势: 1. 数据集成:DW2.0构架着重强调数据集成,通过整合来源于不同地方的数据,构建一个具有一致性、准确性和完整性的数据集,以供企业各个层级的决策者使用。这种数据集成能力可以帮助企业更好地发现数据之间的关联,提供更准确的分析结果。 2. 弹性架构:DW2.0构架采用了弹性架构的概念,即能够根据不同的业务需求和数据规模进行灵活地扩展和调整。这种弹性架构能够适应数据规模的不断增长和业务需求的变化,保证数据仓库的性能和可扩展性。 3. 分析能力:DW2.0构架提供了更高级别的数据分析能力,包括数据挖掘、机器学习、大数据处理和可视化等。这使得企业能够更好地理解和利用数据,发现隐藏在数据中的价值,从而支持更深入的业务决策。 4. 数据质量管理:DW2.0构架注重数据质量管理,通过建立数据质量度量和监控机制,提高数据的准确性、一致性和可信度。这有助于企业更好地利用数据,并在决策过程中避免错误和偏差。 总之,DW2.0构架下一代数据仓库构架的核心概念,通过强调数据集成、弹性架构、分析能力和数据质量管理,帮助企业更好地应对复杂的数据环境和业务需求,实现更准确、高效的决策和分析工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值