离线数仓-指标体系分析
前言
前面对数据仓库的设计过程进行了了解,这里对数仓的指标体系进行分析。
一、最近1/7/30日各渠道访客数
原子指标=业务过程+度量值+聚合逻辑
派生指标=原子指标+统计周期+业务限定+统计粒度
以这个作为第一个例子进行分析:
第一步,最近1/7/30日各渠道访客数明显是一个需求,是不需要依赖于其他指标的,所以是派生指标
第二步,对派生指标进行拆分,它的原子指标是访客个数,它的统计周期是最近1/7/30日,它的业务限定无,它的统计粒度是渠道
第三步,对原子指标进行拆分,访客个数(不是访问次数)的业务过程是页面浏览,它的度量值是mid_id,它的聚合逻辑是count(distinct())
二、最近1/7/30日各渠道会话平均停留时长
原子指标=业务过程+度量值+聚合逻辑
派生指标=原子指标+统计周期+业务限定+统计粒度
衍生指标依赖于一个或多个派生指标
以这个作为第一个例子进行分析: