《数据服务》
一、背景:数据在经过ETL后,会导出到各自业务组中,进行后续实时数据分析,但一旦数据量大后,各组需要根据业务特点,花费大量精力做性能调优,引入大量分析框架。随着数据量的增长,目前存在较多性能不如人意的数据查询服务,因此需要提升数据仓库管理平台的实时数据服务整合能力,统一解决数据从离线的数据仓库转换为在线数据服务的问题,进一步降低整体开发成本。
二、目标:完善实时数据服务整合能力,统一解决数仓到数据服务的开发成本问题和实时分析性能问题,具体为:
(1)在数据仓库管理平台中集成统一的从离线的数据仓库转换为在线的数据服务的配置化解决方案。
(2)提高实时数据分析性能,满足业务发展的需要。
三、常用数据服务场景分析
场景1:维度固定的OLAP数据分析场景
事实表和维度表都固定:
case:分析店铺一年内售卖的销售总额:如下表为事实表和维度表拉平所产生的宽表,那么直接在数据宽表上进行聚合,即可分析出每个店铺一年内售卖的销售总额;