大数据DW架构记录

笔记记录


  • DW一直以来是企业信息与决策支持系统的核心组件,随着各类日志、社交、传感等非结构化数据的加入,企业内部数据按指数级增长,传统DW已经达到一个关键临界点——需要大量的资源投入到硬件、优化、支持和维护中,当前大部分使用Apache Hadoop来处理各种来源的大数据,但传统数据仓库不允许最终用户查询非结构化数据,此外,传统数据仓库并没有针对低延迟大容量数据负载和高吞吐量复杂分析工作负载进行优化——而这是大数据的需求之一。

文章出处https://www.cnblogs.com/tgzhu/p/5874234.html



大数据DW逻辑架构


  • 企业级数据仓库架构
    在这里插入图片描述
  • 利用大数据增强你的数据仓库
    在这里插入图片描述
  • 基于大数据技术的DW 逻辑架构
    在这里插入图片描述

IBM产品架构


在这里插入图片描述

微软大数据架构


在这里插入图片描述

elema DW


在这里插入图片描述

某互联网公司DW


在这里插入图片描述

美团平台


在这里插入图片描述

大众点评实时计算


在这里插入图片描述

TDH DW


在这里插入图片描述

Discover


数据挖掘产品
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
通过学习“大数据环境准备、一键启动大数据环境、DW面临的挑战、数仓分层架构与优势、DW/BI数据开发项目流程”,我获得了以下几点收获: 1. 大数据环境准备:了解了在构建大数据环境之前需要考虑的因素,如硬件需求、软件安装和配置、网络设置等。同时,还学习到了一些常见的大数据技术栈,如Hadoop、Spark、Hive等,以及它们在大数据处理中的作用。 2. 一键启动大数据环境:学习了如何使用一键启动工具来快速部署和配置大数据环境,节省了手动安装和配置的时间和精力。这对于快速搭建开发、测试和生产环境非常有帮助。 3. DW面临的挑战:了解了数据仓库(DW)面临的一些挑战,如数据质量、数据一致性、数据集成等。同时,还学习到了如何通过合适的架构和技术来应对这些挑战,以确保数据仓库的稳定和可靠性。 4. 数仓分层架构与优势:学习了数仓分层架构的设计原则和优势。通过将数据仓库划分为多个层次,如原始数据层、数据集成层、数据存储层和数据展示层,可以实现数据的分层管理和灵活使用,提高数据的可用性和可维护性。 5. DW/BI数据开发项目流程:了解了DW/BI数据开发项目的生命周期和常用的开发流程,如需求分析、数据建模、ETL开发、数据质量控制、报表开发和部署等。这些流程和方法可以帮助团队高效地完成数据开发项目,并保证项目的质量和进度。 总的来说,通过学习以上内容,我对大数据环境准备、数据仓库架构和开发流程有了更深入的了解,并且掌握了一些实际应用的技能和方法。这些知识将对我未来的工作和学习有很大的帮助。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值