关于作者:小姬,某知名互联网公司产品专家,对数据采集、生产、加工有所了解,期望多和大家交流数据知识,以数据作为提出好问题的基础,挖掘商业价值。
0x00 前言
我将整理文章分享数据工作中的经验,因为业务内容上的差异,可能导致大家的理解不一致,无法体会到场景中的诸多特殊性,不过相信不断的沟通和交流,可以解决很多问题。前面我们分析了职场基本功、数据指标体系,少量的数据仓库内容,今天我们来就工作中经常遇到的数据维护问题,聊一下流量日志的维度表搭建思考。
历史导读:
以下,Enjoy:
0x01 问题场景描述
0x01 我遇见的问题场景描述
前面文章中我们提到过《基于指标体系的数据仓库搭建和数据可视化》,强调了指标体系对数据数据仓库搭建和数据可视化的必要性和重要性。例如我们的指标体系如下:
表头:
日期、城市、品类、页面、访问人数、订单数、交易金额
在这个指标体系,依然会存在很多问题,以维度“页面”为例,我们知道在遍历枚举页面值的时候,常常因为埋点数据的历史“包袱”和规则的不稳定因素,导致很多意想不到问题的。
场景举例
1.某产品页面 A 最初上线页面埋点<