数仓设计的几点原则

本文探讨了数仓设计的几个核心原则:高内聚、低耦合确保模块职责清晰,易于维护;复用减少重复建设,提高效率;可重刷保证数据正确性;命名规范促进团队沟通;以及适时重构提升系统性能和指标一致性。这些原则对于构建高效、稳定的数仓至关重要。
摘要由CSDN通过智能技术生成

01 - 高内聚、低耦合

高内聚、低耦合是软件设计的常见概念,特别是在软件模块划分中会被常常提起,需要将功能相同的内聚在一起,将职责不同的功能解耦, 比喻说常见的MVC 分层模式,每一层负责单独的功能。高内聚、低耦合可以使得软件模块职责划分清晰,后期扩展性强,便于维护。

从上面的描述可知,高内聚、低耦合也就是怎么合、如何拆,对于数仓中合并与拆分,常常发生在模型设计中:水平拆分/合并、垂直拆分/合并,不管是对于实事表还是维表设计都需要做这两点的考量,可以将业务相似、表达粒度相同、产出时间相近的模型合并在一起。

02 - 复用

复用就是使用现成已有的能力,减少重复的建设工作。常见中台很重要的一个能力就是复用,常见电商中商品中台、交易中台等业务中台,其上层可以支撑跨境、本地化等不同的业务模式,减少每种业务模式下的基础能力建设工作。

在数仓建设中,复用主要体现在中间层的建设:一、在早期业务快跑模式下,可能会产生很多数据采集、清洗等标准化的工作,各个业务线或者是使用方建设自己使用的中间层,完全是一种烟囱式的开发方式,会造成模型混乱、不断重复建设,因此可以将中间层提取出来统一建设,使其可复用;二、计算指标复用,将一些被多次使用的指标沉淀下来,减少重复计算并且也可以减少指标一致性问题。

03 - 可重刷

可重刷也就是可以重复执行,在数仓中是比较常见的操作,经常性会因为逻辑变更、数据变更、任务失败等需要执行任务重跑操作。在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值