指标体系架构
名词术语
数据域:指面向业务分析,将业务过程或者维度进行抽象的集合。其中,业务过程可以概括为一个个不可拆分的行为事件,在业务过程之下,可以定义指标;维度是指度量的环境,如买家下单事件,买家是维度。为保障整个体系的生命力,数据域是需要抽象提炼,并且长期维护和更新的,但不轻易变动。在划分数据域时,既能涵盖当前所有的业务需求,又能在新业务进入时无影响地被包含进已有的数据域中和扩展新的数据域。
业务过程:指企业的业务活动事件,如下单、支付、退款都是业务过程。 请注意,业务过程是一个不可拆分的行为时间,通俗地讲,业务过程就是企业活动中的事件。
时间周期:用来明确数据统计的时间范围或者时间点,如最近 30 天、自然周、截至当日等
修饰类型:是对修饰词的一种抽象划分,修饰类型从属于某个业务域,如日志域的访问终端类型涵盖无线端、 PC端等修饰词
修饰词: 指除了统计维度以外指标的业务场景限定抽象。修饰词隶属于一种修饰类型,如在日志域的访问终端类型下,有修饰词 PC 端、无线端等。
度量/原子指标:原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名词 ,如支付金额
维度:维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为实体对象。维度属于一个数据域,如地理维度(其中包括国家、地区、省以及城市等级别的内容)、时间维度(其中包括年、季、月、周、日等级别的内容)
维度属性:维度属性隶属于一个维度如地理维度里面的国家名称、国家 ID 、省份名称等都属于维度属性
派生指标:派生指标= 一个原子指标+多个修饰词(可选)+时间周期 。可以理解为对原子指标业务统计范围的圈定。如原子指标:支付金额,最近1天海外买家支付金额则为派生指标(最近1天为时间周期,海外为修饰词,买家作为维度,而不作为修饰词)
指标体系
1.基本原则
(1)组成体系之间的关系
-
派生指标由原子指标、时间周期修饰词、若干其他修饰词组合得到
-
原子指标、修饰类型及修饰词,直接归属在业务过程下,其中修饰词继承修饰类型的数据域。
-
派生指标可以选择多个修饰词,修饰词之间的关系为“或”或者“且”,由具体的派生指标语义决定。
-
派生指标唯一归属一个原子指标 ,继承原子指标的数据域,与修饰词的数据域无关。
一般而言,事务型指标和存量型指标(见下文定义)只会唯一定位到一个业务过程,如果遇到同时有两个行为发生、需要多个修饰词、生成一个派生指标的情况,则选择时间靠后的行为创建原子指标,选择时间靠前的行为创建修饰词。
-
原子指标有确定的英文字段名、数据类型和算法说明:派生指标要继承原子指标的英文名、数据类型和算法要求。
(2)命名约定
- 命名所用术语。指标命名,尽量使用英文简写,其次是英文,指标英文名太长时,可考虑用汉语拼音首字母命名。如中国质造,用zgzc 。在 OneData 工具中维护着常用的名词术语,以用来进行命名。
- 业务过程。英文名:用英文或英文的缩写或者中文拼音简写;中文名:具体的业务过程中文即可。
关于存量型指标(见下文定义)对应的业务过程的约定:实体对象英文名+_stock 。如在线会员数、 一星会员数等 ,其对应的业务过程为mbr_stock;在线商品数、商品 SKU 种类小于5的商品数,其对应的业务过程 itm_stock
-
原子指标。英文名 :动作+度量:中文名:动作+度量。原子指标必须挂靠在某个业务过程下,如原子指标支付金额挂靠在交易域顶订单支付业务过程下。
-
修饰词。只有时间周期才会有英文名,且长度为2位,加上“_”为3位,例如_1d。其他修饰词无英文名。
常见修饰表如下:
常用的时间周期修饰词
中文名 英文名 中文名 英文名 最近1天 1d 自然月 cm 最近3天 3d 自然计度 cq 最近7天 1w 截至当日 td 最近14天 2w 年初截至当日 sd 最近30天 1m 零点截至当前 tt 最近60天 2m 财年 fy 最近90天 3m 最近1小时 1h 最近180天 6m 准实时 ts 180天以前 bh 未来7天 flw 自然周 cw 未来4周 f4w -
派生指标。英文名: 原子指标英文名+时间周期修饰词( 3位,
例如_Id) +序号( 4位,例如一001 );中文名:时间周期修饰词
+[其他修饰词]+原子指标。
(3)算法
原子指标、修饰词、派生指标的算法说明必须让各种使用人员看得
明白,包括
- 算法概述一一算法对应的用户容易理解的阐述。
- 举例一一通过具体例子帮助理解指标算法。
- SQL 算法说明一一对于派生指标给出 SQL 的写法或者伪代码。
2.操作细则
(1)派生指标的种类
派生指标可以分为 事务型指标、存量型指标和复合型指标。按照其特性不同,有些必须新建原子指标,有些可以在其他类型原子指标的基础上增加修饰词形成派生指标。
- 事务型指标 是指对业务活动进行衡量的指标。例如新发商品数、重发商品数、新增注册会员数、订单支付金额,这类指标需维护原子指标及修饰词,在此基础上创建派生指标。
- 存量型指标:是指对实体对象(如商品、会员)某些状态的统计。例如商品总数、注册会员总数,这类指标需维护原子指标及修饰词,在此基础上创建派生指标,对应的时间周期一般为“历史截至当前某个时间”。
- 复合型指标:是在事务型指标和存量型指标的基础上复合而成的。例如浏览 UV-下单买家数转化率,有些需要创建新原子指标,有些则可以在事务型或存量型原子指标的基础上增加修饰词得到派生指标。
(2)复合型指标的规则
- 比率型: 创建原子指标,如 CTR(广告的实际点击次数/广告的展现量) 、浏览 UV -下单买家数转化率、满意率等。例如,“最近1天店铺首页 CTR”,原子指标为“ CTR ”,时间周期为“最近1天”,修饰类型为“页面类型”,修饰词为“店铺首页”。
- 比例型:创建原子指标,如百分比 、占比。例如“最近1天无线支付金额占比”,原子指标为“支付金额占比”,修饰类型为“终端类型”,修饰词为“无线”。
- 变化量型:不创建原子指标,增加修饰词,在此基础上创建派指标。例如,“最近1天订单支付金额上1天变化量”,原子指标为“订单支付金额”,时间周期为“最近1天”,修饰类型为“统计方法”,修饰词为“上1天变化量”。
- 变化率型:创建原子指标。例如,“最近7天海外买家支付金额上7天变化率”,原子指标为“支付金额变化率”,修饰类型为“买家地域”,修饰词为“海外买家”。
- 统计型 (均值、分位数等):不创建原子指标,增加修饰词,在此基础上创建派生指标;在修饰类型 “统计方法”下增加修饰词,如人均、日均、行业平均、商品平均 90 分位数,70 分位数等。例如,“自然月日均 UV”,原子指标为“UV”,修饰类型为“统计方法”,修饰词为“日均”。
- 排名型 创建原子指标, 一般为 top_xxx_xxx ,有时会同时选择rank和top_xxx _xxx 组合使用。创建派生指标时选择对应的修饰词如下:
- 统计方法(如降序、升序)。
- 排名名次(如 TOP 10 )。
- 排名范围(如行业、省份、一级来源等)。
- 根据什么排序(如搜索次数、 PV )。