大数据-数据仓库分层概念

前言

  • 数据仓库的分层是一种组织和管理数据的方法,它帮助用户更有效地处理和分析数据

为什么要对数据仓库分层:

  • a)用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据;
  • b)如果不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大
  • c)通过数据分层管理可以简化数据清洗的过程,因为把原来一步的工作分到了多个步骤去完成,相当于把一个复杂的工作拆成了多个简单的工作,把一个大的黑盒变成了一个白盒,每一层的处理逻辑都相对简单和容易理解,这样我们比较容易保证每一个步骤的正确性,当数据发生错误的时候,往往我们只需要局部调整某个步骤即可。

数据仓库的分层模型通常包括以下几个主要层次:

数据引入层(ODS层Operation Data Store)

  • ODS层不对原始数据做任何处理,与业务系统中数据一致。在业务系统和数据仓库之间形成一个隔离,业务系统数据结构的变化不影响其他数据分层。同时减轻业务系统被反复抽取的压力,由ODS统一进行抽取和分发。

公共维度层(DIM, Dimension)

  • 这一层包含用于描述业务数据的特征的信息,如地理位置、时间等。

数据明细层(DWD层 Data Warehouse Detail)

  • 这一层接收并处理来自ODS层的原始数据,进行清洗、标准化、维度退化、异常数据剔除等操作,为数据分析提供支持。

数据汇总层(DWS层 Data Warehouse Summary)

  • DWS层数据 按主题对数据进行抽象、归类,提供业务系统细节数据的长期沉淀。这一层是一些汇总后的宽表,是根据DWD层数据按照各种维度或多种维度组合,把需要查询的一些事实字段进行汇总统计。可以满足一些特定查询、数据挖掘应用,面向业务层面,根据需求进行汇总。

数据应用层(ADS层Application Data Service)

  • ADS应用层是根据业务需要,由DWD、DWS数据统计而出的结果,可以直接提供查询展示,或导入至Oracle、Mysql、Doris等数据库中使用,加速数据查询性能,提供数据服务。

总结

如果此篇文章有帮助到您, 希望打大佬们能关注点赞收藏评论支持一波,非常感谢大家!
如果有不对的地方请指正!!!

  • 6
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lfwh

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值