本文是个人的一些经验和思考,欢迎留言讨论。
先说一下冗余和范式的特点:
冗余是以存储换取性能,
范式是以性能换取存储。
因此,一般在实际工作中冗余更受欢迎一些。
模型设计时,这两方面的具体的权衡,首先要以企业提供的计算能力和存储资源为基础。
其次,一般互联网行业中都根据Kimball模式实施数据仓库,建模也是以任务驱动的,因此冗余和范式的权衡符合任务需要。
例如,一份指标数据,必须在早上8点之前处理完成,但计算的时间窗口又很小,要尽可能减少指标的计算耗时,这时在计算过程中要尽可能减少多表关联,模型设计时需要做更多的冗余。
建模中冗余和范式的权衡
最新推荐文章于 2024-08-14 17:31:23 发布