如何衡量数仓建模建的好不好?

数仓建模是数据仓库很关键的一步,需要通过建模的方法更好的组织、存储数据,以便于在性能、成本、效率和数据质量之间找到最佳平衡点,其主要关系到以下4点:

  • 访问性能:能够快速查询所需的数据,减少数据I/O
  • 数据成本:减少不必要的数据冗余,实现计算结果数据复用,降低大数据系统中的存储成本和计算成本
  • 使用效率:改善用户应用体验,提高使用数据的效率
  • 数据质量:改善数据统计口径的不一致性,减少数据计算错误的可能性,提供高质量的、一直的数据访问平台

所以,数仓建模如果做得好能够大大的提高后续工作的效率、便利性等等,判断数仓建模好坏主要根据以下5点原因:

1、业务方取数据是否方便,包括指标 维度 信息等
2、发现数据计算错误时   是否能清晰定位该逻辑整个流程逻辑
3、新业务进来时  是否能合并进现有层级
4、仓库层级数据计算中,是否完美运行并且保证批处理时效性
5、层级模型是否完整,中间表是否比较少,是否存在多层甚至多个跨层调用

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值