数据仓库为什么要执行分层 1 清洗数据结构, 2 数据血缘追踪, 3 减少重复开发 4 任务分解,复杂拆分成多个小步骤来实现 5 屏蔽原始数据的异常,避免造成数仓跟着大动作的修改 如果不分层可以吗? 不分层在技术实现以及理论上是可行, 但是会有很多弊端, 比如工作的重复, 一个指标可能从数据清洗到最终数据导出会在一条sql中完成, 或者自己实现分阶段落地,但是每个指标可能阶段不同导致后期维护难度增大。 所以实际中企业都遵守约定俗成的分层规则。