《数据建模规范》
上一章节中,我们阐述了数据定义上的规范化制定方法,使得我们在看到数据表和指标的时候能清晰知道其代表的业务意义,而本章节的《数据建模规范》会指导我们如何有组织有条理的建设和维护这些数据,使得我们能快速定位到数据,避免烟囱式开发,降低研发成本。就像杂乱的图书散落在地,我们需要像图书馆那样,通过分类,索引等管理机制,有效管理书籍;
举个例子:存在如下三个基表:账户表,订单表,物流表,其中业务1统计的指标从账户表,订单表而来,业务2统计的指标从账户表,物流表而来,业务3统计的指标从订单表和物流表聚合而来,这种数据建模有什么问题呢?主要体现在下面三点:
(1)数据研发成本高:烟囱式数据开发,所有数据指标计算都从底层表抽取,可能业务2的指标能直接从业务1指标表获得,无需再次从底层表抽取,这样会导致业务复杂度增加,且浪费计算资源,从而加大研发成本;
(2)维护成本高: