目录
最近在工作中也经常和标签、指标打交道,但是似乎很少有人能完全说明白这两者的明确定义、区别和联系,今天尝试来聊聊这个问题。
内容
本来应该先从定义开始,但是数据玩家找了很多定义,总感觉很晦涩,需要一定的深入思考和实践经历才能完全理解,于是我们先暂时不看定义,从两者的特征开始比较,第一个特征是两者的内容。
指标通常描述客观事实
常见的指标,宏观层面比如GDP、CPI、PPI,金融机构常用的存贷比、不良率、AUM,产品运营的MAU、DAU、LTV等等,都是对一个客观事实的描述,通常以可量化的数值形态呈现,或为数值,或为比率。
一个指标通常包含三个部分:口径/逻辑、维度、限定词。
口径和逻辑,也就是这个指标具体的含义,首先得有一个业务口径,然后由技术把他落地成为一个技术的加工逻辑,从哪几个表取,count、sum、max、min或者是avg。
维度指的是我们从什么角度去看这个指标,是时间维度(年/月/日)、机构维度(不同分支机构)还是客群或产品维度,在SQL语句里就是group by。
限定词就是在这个维度下,我们选取哪一个具体的枚举值,对应SQL语句就是where条件。
举个栗子,AUM的业务口径是客户名下所有资产,包括存款、理财、代销基金、保险等…… 技术的加工逻辑会有一长串SQL,关键的点是所有金额做sum。
如果只看全行的AUM,是不需要维度的,如果要看具体某一个维度,就需要group by了,指标就变成了按机构维度看AUM,即group by org。
限定词就是要看某个具体分行,比如上海分行所有客户的AUM,SQL语句里就需要加上 where org = '021'。
不论怎么定义,大家可以发现,每一个环节都是陈述事实,实际的