作为业务侧的数据分析师,在实际的工作中,很多同学可能都是转行做了数据分析,有的是业务运营的小伙伴,有的是产品经理的小伙伴,这些方向的小伙伴们,可能对业务的运行和策略比较了解,有的对产品框架和结构比较了解,但是对于数据本身的认识,可能是不够清晰的。
从事数据分析这个领域,理解数据和解读数据都是非常重要的,这篇文章会帮助大家对数据和业务指标有一个基础的理解。
一、认识数据
1.数据是什么?
数据由维度和指标构成。
1.1维度
可以理解为对数据的分类,数据的属性和特征。下面列举了几种维度,直观的有一个更清晰的认识。
时间维度
日、周、月、季、年
地区维度
国家、省、市、区、县
性别维度
男、女
品类维度
数码、服饰、酒水、生鲜
1.2指标
是对事件的量化形成的数值,指标还可以分为原子指标,派生指标和复合指标。
原子指标(基础指标):业务模式下最小粒度不能再分割的指标,它定义了数值从哪里取得,如何计算。如销量,销售额,活跃人数等,活跃人数就是对user_id 进行计数而得来。
派生指标:原子指标+时间周期+修饰词,用户可以根绝自身业务需求进行组合。
复合指标:建立在原子指标之上,通过一定运算规则形成的计算指标集合,如客单价,留存率等。
原子指标
某电商的消费用户数、销售金额
派生指标
双11某电商的消费用户数
复合指标
客单价(销售金额/消费用户数)
2.真实的数据长什么样
对于数据分析师来说,我们看到的数据大部分都是以表格形式存在。
根据刚才的讲解,我们来看一下哪些是维度,哪些是指标。
维度:性别、下单日期
指标:销量、销售额。计数的用户id,计数的订单编码对应的是下单用户数和订单量的复合指标。同样,求和的销量和求和的销售额也是复合指标。
二、人货场
人货场这个概念,是互联网的高频词汇,同时业务侧需要的数据,总是围绕着人、货、场展开。
1. 概念
人货场在互联网时代就是一个经常被提到的词,业务上,用户与产品发生交互的场景,会产生一系列的数据,这些数据都来自于人货场。这个解释可能不太容易理解,下面我们把将人、货、场一个一个拆开,从数据分析师的角度进行理解。
2.电商行业举例
三、指标体系
1. 概念
指标体系可以理解为,帮助业务看清数据,同时监控数据的变化。
这里的指标:是与业务场景相结合下的指标。比如,电商会看GMV、客单价、订单量、订单金额、DAU、MAU;呼叫中心会看进线量、接起率、CPO、CPD;共享经济会看人均单,共享实体均单,新客转化率。这些指标,结合不同场景,不同维度后,就形成了体系。业务看指标,不会单维看,一定是交叉看。
业务场景:人+产品;线上场景,给经济不富裕的人创建下单+白条场景;线下场景给爱喝咖啡爱玩手机的人创建咖啡馆+充电宝场景。诸如此类。
这是不是与我们刚才讲到的人货场也非常相似呢?其实不管是业务还是数据,总是围绕这三个要素展开。
2. 构建指标体系
2.1同业务方确认展示维度及一二三级指标
展示维度:指标体系一般是为业务方提供支持的,老板们也会对指标体系有所关注,所以一般在构建体系的时候我们会做宏观和微观两个维度的指标体系。
一二三级指标:根据优先级不同,指标的重要性也不同,与kpi相关的我们当做一级指标,就是最重要的,用来衡量业务发展好坏,如收益率、GMV。根据业务模式,将一级指标向下详细拆解成为二级指标,如流水和成本作为收益率的分子分母可以作为体系的二级指标。三级指标就是更细致的不同业务场景的指标数据了,这些数据主要是为业务运营人员提供帮助。比如到店铺,到部门,到品类等等更细化的维度。
拉齐口径:再确认了需要看哪些指标后,要与业务方确认数据的口径,也就是这些指标的具体定义,这一步非常重要,是让指标对业务赋能最重要的一步。
场景举例:CEO说:”我想看我有哪几家店在赚钱”这里的赚钱,就是是否有收益,我们可以根据收益首先确定第一个指标,收益率。收益率为正就是赚钱。收益率可以作为一级指标,向下拆分就是流水和成本,成为二级指标。再向下拆解,看到门店,就是到门店维度的流水、成本,作为三级指标。
成本,可以拆分成店铺租金、水电煤费用、实物损耗、产品成本等。
流水,可以总订单金额、订单金额刨除优惠金额等来计算。
2.2数据提取
使用取数工具进行,一般我们会使用SQL语言,这些要找到技术侧问清楚所需数据用到的数据库表,大部分情况都需要多表关联,了解清楚这些表的关联逻辑也非常关键。
2.3形成数据产品
形成的数据集导入到数据可视化载体,Tableau或者类似的公司自带的数据可视化工具,根据需求进行不同指标的图表图形交叉展示形成数据看板。业务侧核验数据,无误后,进入看板监控及后续迭代。