系列文章目录
Python数据科学家养成计划(数据分析 LEVEL I 考证)文章目录
前言
随着人工智能的不断发展,数据科学相关技术也越来越重要,很多人都开启了学习数据科学相关知识体系的学习之旅,本文就介绍了数据科学中数据分析 LEVEL I 考证的知识体系内容。
一、指标概念
1. 指标的作用
用简约的汇总数据量化业务强弱。
2. 指标的理解
(1)解释: 对度量的汇总,即数据的汇总规则。
特点:
a、指标是游离态的,无法单独实现数据统计,如总销售额、总销售量;
b、需与统计维度结合,明确统计指标的对象,如产品时间维度下,X年所有产品的总销售额;
c、指标间可自由组合形成新指标,灵活适应多变的业务环境。
(2)度量: 对可参与汇总计算的字段。
(3)汇总规则: 汇总字段的统计规则。如:求和、求平均、计数等…
二、基本指标
1. 基本指标
- 求和类
- 了解各数据的整体情况
- 往往结合数值型数据使用
- 计数类
- 了解各数据的数量情况
- 往往结合文本型数据使用
- 比较类
- 作为参照指标
- 评定主指标的表现
1.1 基本指标—求和类
(1)常规求和: 对度量求和计算得到的指标。诸如销售数量、销售金额指标结合特定维度的统计结果,用以帮助决策者了解整体情况。
例 1: 按照产品维度对销售金额进行求和计算得到不同产品的销售总金额。
例 2: 按照月份维度对销售数量进行求和计算得到不同月份的总销量。
(2)累计求和: 随时间维度变化,从时间初值点至当前时间点时间段内度量的累加值,用以帮助决策者了解事件初期至当前时间点的业务状态。
例 1: 以 1 月 1 日为初始点,查看每日实际销量及初始点至今当日的累计销量。
注: 诸如库存数量类指标本身具备累积属性,不需要再进行累计。
1.2 基本指标—计数类
(1)时间维度下的累计指标: 此类指标不受自然年、季度等周期限制,从初始时间点至当前时间点的时间区间进行分析,不仅体现了时间维度的连续性,还可结合指定维度下的指标值分析变化趋势。
- YTD(Year to Date): 从年初到当前日期为止的【指定维度的】汇总值。
- QTD(Quarter To Date): 从季度初到当前日期为止的【指定维度的】汇总值。
- MTD(Month To Date): 从月初到当前日期为止的【指定维度的】汇总值。
- WTD(Week To Date): 从周初到当前日期为止的【指定维度的】汇总值。
对度量计算得到的指标,度量一般为文本型数据,需注意数据的唯一性。
例 1: 下表为消费明细数据,统计消费的订单数为 5。
1.3 基本指标—比较类
(1)差异百分比: 指定维度下指标的某个值为基准点,比较当前值和指定值的差异变化率,用以帮助决策者了解当前数值的好坏。
均比: 与维度下指标的平均值比较,辅助决策者了解维度下哪项拉高了均值,哪些项拉低了均值。
公式: (当前值 - 均值) / 均值 * 100%
例 1: 下表为各个区域下城市的消费金额,统计每个城市相比于区域内城市均值的差异百分比。
定基比增长率: 当期值与某一固定时期值对比,用以描述当期值的发展水平。
公式: (当前值 - 固定时期值) / 固定时期值 * 100%
例 1: 2010 年某市新生儿 5000 人作为往后每年的参考值,统计往后各年的定基比增长率。
同环比增长率: 时间维度下某两个时间项对应指标值对比,用以描述当期值的发展水平。
同比公式: (当前值 - 去年同期值) / 去年同期值 * 100%
环比公式: (当前值 - 上期值) / 上期值 * 100%
例 1: 下面两表为时间维度下销量汇总值,统计各时间维度下的同环比变化率。
三、常用场景指标
1. 常用场景指标—用户
2. 常用场景指标—流量相关指标
量 | |
---|---|
访客数(UV) | 访问对应维度的非重复用户数 |
浏览量(PV) | 维度下浏览页面的总次数 |
访问次数(Visits) | 统计会话数,一个会话内用户连续访问多个页面 |
新访客数 | 新进访客数 |
质 | |
平均访问深度 | 浏览量 / 访问次数 |
跳失率 | 跳出次数 / 访问次数 |
新访客占比 | 新访客数 / 总访客数 |
例 1: 用户 x 在 12 月 25 日上午通过平台搜索页点击到达店铺 A,浏览了 2 个页面后离开店铺,下午 X 又通过首焦广告位点击重新到达店铺 A,浏览了 3 个页面后离开,A 店铺当天只有 X 一人访问,那么店铺 A 的以下指标各是多少?
- 访客数(UV) = 1
- 浏览量(PV) = 5
- 访问次数 = 2
- 平均访问深度 = 5 / 2 = 2.5
- 跳失率 = 0
3. 常用场景指标—用户相关指标
- 注册用户
我在 xxxx 年 xx 月 xx 日 xx 时 xx 分 xx 秒注册了,编号是 X001
我在 xxxx 年 xx 月 xx 日 xx 时 xx 分 xx 秒通过弹框广告来到这里
我曾经在 xxxx 年 xx 月 xx 日 xx 时 xx 分 xx 秒购买了商品 X 消费了 Y 元
我在 xxxx 年 xx 月 xx 日 xx 时 xx 分 xx 秒购买了商品 X 消费 Z 元
- 非注册用户
有人在 xxxx 年 xx 月 xx 日 xx 时 xx 分 xx 秒通过弹窗广告来到这里
有人在 xxxx 年 xx 月 xx 日 xx 时 xx 分 xx 秒浏览了商品详情页 www.XXXXXX.com
有人在 xxxx 年 xx 月 xx 日 xx 时 xx 分 xx 秒购买了商品 X 消费了 Y 元
例 1: 统计 2021/01/01 消费的会员数和消费的非会员数,会员编号为空则为非会员。
消费会员数: 4(M110 M283 M002 M113)
消费非会员数: 6
4. 常用场景指标—客户相关吗指标
5. 常用场景指标—转化相关指标
转化率: 根据业务流程观测阶段间流转后的留存比率,用以辅助决策者了解阶段间衔接的流畅性。
公式: 当前阶段 / 初始阶段(或上一阶段)* 100%
6. 常用场景指标—营运、销售类指标
成交额: GMV、实际销售额、税后销售额、退款额。
成交量: 实际订单量、商品销量。
完成情况: 目标达成率、退货率。
效果: 屏效、商品相关性。
7. 常用场景指标—商品
商品层级关系:
8. 常用场景指标—商品相关指标
商品的生命周期:
9. 常用场景指标—活动相关指标
渠道引流:
- 触达用户数量
- 新增注册用户数
- 渠道投放成本
- 营销内容设计成本
- 营销人工成本
- …
着陆页至详情页转化:
- 着陆页停留时长
- 详情页停留时长
- 着陆页至详情页转化率
- …
详情页至下单页转化:
- 详情页至其他页转化率
- 详情页至下单页转化率
- …
下单支付转化:
- 下单页停留时长
- 下单页至支付页转化率
- 支付停留时长
- …
销售业绩:
- 销售金额(活动 VS 非活动)
- 销售量(活动 VS 非活动)
- 投资回报率
- …
10. 常用场景指标—绩效类指标
四、指标的设计
1. 设计新指标
作用: 用简约的汇总数据量化业务强弱。
目的: 根据需求量化考核点(在技术支持的情况下)。
例 1: 某公司的招聘流程如下,业务部门项目上的员工一直抱怨刚入职的同事技术能力差,导致大部分人都未通过试用期,HR 一直忙碌招人和办理离职流程,总感觉哪里有问题,希望通过数据评定各部门入职员工是否适合岗位,并帮助发现哪个招聘环节可能出现问题。假设数据都支持数据统计。
五、指标的分析方法
1. 指标的分析方法
运用指标量化业务强弱需明确指标的好坏变化:
- 时间周期下指标的变化规律;
- 指定维度下不同项的指标值的差异;
- 提供当前时间点对应维度的指标累计值或瞬时值,对比基准值。
(1)指标的分析方法—纵向分析
时间周期下指标的变化规律:
(2)指标的分析方法—横向分析
指定维度下不同项的指标值的差异:
(3)指标的分析方法—预警分析
提供当前时间点对应维度的指标累计值或瞬时值,对比基准值: