1 基本概念
1.1 实体
从业务角度讲,实体是为了满足分析的需要,抽象出来的概念,从业务中拆分出一个个实体,可以是现实存在的业务对象,如用户,商家,商品,也可以是现实没有的,如虚拟的业务对象,活动,会员等等
1.2 维度
维度是度量的基础,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为一个实体对象。
在划分数据域、构建总线矩阵时,需要结合对业务过程的分析定义维度。
1.3 业务过程
业务过程是指企业的业务活动事件,如下单、支付、退款都是业务过程。通常业务过程是企业活动中的事件,因此业务过程是一个不可拆分的行为事件。
1.4 原子指标
原子指标是对指标统计口径、具体算法的抽象,等于业务过程(原子的业务动作)+ 统计方式,统计方式通常是做聚合计算。例如,支付(事件)金额(度量)ÿ

本文详细介绍了数据仓库的基本概念,包括实体、维度、业务过程、原子指标、派生指标(衍生指标)等。原子指标是不可再拆分的业务事件度量,派生指标则是基于原子指标、业务限定、统计周期和维度的组合。此外,文章对比了指标与标签的差异,指标用于业务过程的衡量,标签是高度精炼的特征标识,经过算法处理。指标的分类和分级,以及缓慢变化维的概念也被阐述。
订阅专栏 解锁全文
4万+

被折叠的 条评论
为什么被折叠?



