数据分析笔记—数据分析篇(上)

数据分析是一个从数据中通过分析手段发现业务价值的过程。
本篇是数据分析笔记的第二篇—数据分析篇,从指标体系、异动分析、指标预测、小流量实验、用户增长、产品分析六个方面来阐述目前企业和业界会用到的数据分析方方面面。
数据分析篇分为上下两篇,上篇主要内容为指标体系、异动分析何指标预测,下篇再介绍小流量实验、用户增长、产品分析三个方面。

一、指标体系

指标体系是什么

指标就是评估业务目标表现或效果的量化参数,最直观的作用就是将业务量化;比如总贷款余额、有贷人数等。与指标对应的是维度,维度是分析量化指标的角度,比如贷款余额中,可以分为用户维度和地区维度等。
指标体系是从不同维度梳理业务,把指标有系统地组织起来;是不同指标按照一定的顺序及内部联系而组成的整体。比如一个人的身高或者体重单独拿出来都无法判断这个人的体型,但是身高+体重放在一起形成的**“体系”**就可以判断这个人的体型,指标体系也就是使用多个指标从不同维度来评估业务,从而更好的了解业务内容和现状。

为什么需要指标体系

通过指标体系,可以把公司每个业务环节量化和透明化,方便了解目标与现状之间的差距,方便思考达到目标的方法;以及当业务出现异常时,就能以最快的速度发现问题,开始分析,然后解决这些问题,最大化地减少损失。(日常观察+异动监测)

指标体系如何搭建

(1)明确北极星指标是什么

北极星指标是最核心的指标,一般就是对于企业或部门,最能反映实际情况的指标,例如对于消费金融公司,北极星指标就是贷款金额和有贷人数。需要注意点是,不同部门的北极星指标往往是不一样的,而且部门的北极星指标也很有可能和企业是不一样的。部门的北极星指标一般是企业北极星指标拆解后的某一项指标。
这里为了统一,我们认定企业而非单独部门的北极星指标使我们讨论的北极星指标。

(2)分解北极星指标

当企业的北极星指标确定后,需要分解拆开。所有人的工作,实际都相当于把北极星指标拆解开,拆解成很多更细小的指标后,自己专注于服务于其中一项的指标。
例如贷款金额=平均贷款金额×有贷人数,有贷人数=还清激活+拉新,那么可能有的部门就专注于拉新的任务,从而服务于贷款金额这一核心指标。而这里的拉新指标,就是这个部门的北极星指标,但不是整个企业的北极星指标,只是企业的二级的指标,在指标体系中呈现。
一般企业的核心指标是一级指标,部门的核心指标是分拆下来的二级指标,落实到每个人,是部门再拆解下来的三级指标;当然,有的部门不同团队的运营方向也有差异,可能不同团队的三级指标不同,落到每个员工的就是四级指标。

(3)构建指标体系

按照上文的分级,已经可以构建出一个指标树或指标图;统一完口径后,可以构建出指标体系监控看板,维护并更新指标体系。
指标体系图解

指标体系的维护

(1)指标之间的关联与拆解

指标体系之间必须要有明确的业务逻辑关系,保证一级指标监控出现问题的时候,能够拆解出来,是在哪个环节出了问题。

(2)指标的拆分需要有业务逻辑

指标体系不仅要能拆解,还需要有确定的业务逻辑,保证拆解完每个指标都能找到确定的业务和对应的负责人,以便定位到问题后解决问题。例如:在销售部门,最关注的是销售目标有没有达成,现在达成了多少,接下来的每天应该达成多少,哪些些区域达成最高,哪些区域达成最低。如果不围绕这个业务目标拆解指标,而是随意把指标拆解为用户年龄、性别,这就与业务没有任何关系,只是为了拆解而拆解。

(3)根据业务发展调整指标方向

指标的方向往往由一级北极星指标决定。对于新创企业来说,北极星指标可能是用户流量和获客相关的指标,而企业较为成熟后,可能会选择盈利相关的指标。当北极星指标更新后,整个指标体系往往也需要变化。同样,二级三级等指标也有可能随着业务的变化而更新,对应的指标拆解体系和工作方向也需要变化。

参考资料

什么是指标体系?
什么是指标体系?一文教你如何搭建指标体系

二、异动分析

异动分析是什么

异动是指监控的指标(一般是一级指标)出现异常变动,比如突增突减、异常值、趋势变差等情况。异动的底层逻辑需要“比较”,对比需要确定比较的是哪个指标、对象是什么(同业对比、时期对比等)以及对比衡量方式(绝对值、相对值)。
因此,我们在确定这三个情况之前,先不要急于去寻找异动原因,因为可能压根就不是异动。例如这样一个问题:“贷款量下降了,寻找一下原因”,不应该这个问题是什么就是什么,而是在数据准确的前提下,先从上面三个角度去验证:
(1)哪里的贷款量下降了,是企业总体还是某单个渠道的贷款数下降了?
(2)这个下降是与其他公司对比,还是和自己前一天对比、前一周对比、还是历史同期对比?
(3)下降了多少?绝对值有多少,相对下降了百分之多少?这个值是否是合理的?
在拿到问题时,一定要先确认是不是真的是异动,再考虑是否需要寻找原因。

为什么要做异动分析

异动分析当然是为了发掘异动,寻找问题,加以解决。
异动出现之后,先要确定是不是真的是异动;确定是异动后,通过指标体系挖掘原因。异动分析一般要解决两个问题(有时候解决第一个就够了):异动是从哪个地方出的问题;异动的原因是什么。
做异动分析,本质原因就是因为在我们确定好核心指标后,就需要为了核心指标去努力,而指标体系监控到问题,需要寻找到问题究竟出在哪里,以及是什么原因,之后交给业务方,去完善现有的策略,弥补异动的问题,帮助核心指标回归正常。

怎么做异动分析

(1)确认数据

首先要确认数据是否正确,数据正确的情况下,要再确认数据是否是真的异常,因为有些所谓的异常实际只是季节性因素或开展活动等原因导致,实际与业务确认可以认为正常,那么这种依然不能算得上是异动。

(2)指标拆解

按照已经搭建好的指标体系,深入挖掘异动数据是从哪个途径来的,一般当最主要的核心指标出现异常后,指标体系的二级三级等低级指标大概率也会有异常(也有可能没有,例如核心指标是两个指标相乘或相加,两个指标未见明显异常,但累积起来到核心指标就会放大这个偏差)。
先总览一下指标体系总体情况,观察这些指标是否有一个异常的传导链路,没有的话需要从相对高级指标开始,一步步按照目前业务发展的现状,确认指标情况是否符合目前发展现状。比如贷款额=有贷人数×人均贷款金额,贷款额出现异常下降时,有贷人数和人均贷款金额下降幅度处于可以接受的幅度,但公司最近的整体战略是拉新客户,人均贷款金额下降正常,但有贷人数应该是上升的,此时也应该将有贷人数看似合理的下降作为异常来拆解挖掘。

(3)挖掘原因

挖掘到异动的指标之后,就要开始分析为什么指标出现异常。一般此时需要联系业务方一起了解情况,数据指明方向之后,需要反馈给业务运营,让业务方按照出现问题的指标下沉到实际业务现状,寻求问题原因所在。实际工作中,业务往往只会向数据分析师了解清楚哪个环节出现问题,因为后面的溯源工作业务运营一般会独立完成,数据分析师的最大作用还是在于给运营一个溯源的方向去求证。

(4)解决反馈

当业务问题解决后,需要给数据分析师反馈,数据分析师重新观察监控指标体系,看数据是否恢复或正在恢复中。否则,需要重新从头开展一遍异动分析看看有没有其他原因。
异动分析流程图

参考资料

数据分析中的『指标异动』你理解正确吗?

三、指标预测

什么是指标预测

指标预测,顾名思义就是对于指标情况未来走势的一个判断预估,这个预估很多时候不是简单说一个上升和下降的趋势就结束的,对于数据分析来说,需要给出上升下降趋势预测的同时,要预估指标数大概会来到什么样的区间范围,以及原因大概是什么,怎样去完成甚至超越(预测变好),或者避免这种趋势(预测变差)的产生。

为什么要做指标预测

很简单一个问题就可以回答,老板经常问:“明年我们的业绩大概能做到什么水平?”,这个问题实际上就需要数据分析师去预测明年会达到的指标情况,这个问题虽然看似简单,但实际上很有内容,说少了老本不一定满意,说多了又很难达到,大家很辛苦的同时还会让老板不满意。
当然指标预测并不一定只是做一个总体的趋势性预测,也有可能是在公司进行某一项活动推广、重点突击某方面业绩时,做更细致的指标预测,判断某一具体运营业务是否达到要求或是大概能达到什么水平
指标预测实际上与前文所讲的指标体系搭建和异动分析实相辅相成的,因为对指标的变动情况有了较为准确的预估后,才能确定指标体系的目标值,然后才能监控到业务运行的过程中是否出现异常异动的情况。

怎么做指标预测

指标预测的基本方式就是时间序列分析,除此之外,像机器学习、回归模型等也是指标预测的基本统计方法。出了统计方法,指标体系本身也对指标预测会有启示,指标体系拆分后,与业务方分别交流可以大概得到每个低级指标的走势情况,最后汇总计算到一级指标上,也是一种预测方案。

(1)时间序列预测

时间序列预测是数据分析中必备的基本预测方法,谈到时间序列分析就不得不提到时间序列比较重要的几个特性:平稳性、季节性、随机性
平稳性指的是整体走势情况,比如近几年总体销售额增长都是大约10%,但增速在下降,那么可以做出预测,明年很可能比今年不会增长到10%,在10%的区间内再去进一步预测。
季节性是指有些产品的盈利情况好坏会受到特定时间段的影响:比如酒厂发现每年节日时,销量更好;游戏公司发现,周末比周中玩家在线活跃情况更好等。这些结论由历史数据得到,有比较明显的因果关系,那么在预测某一日或某一段时间的指标情况时要特别关注。
随机性就是除了以上能解释出原因的特征之外,难以解释的随机波动情况。一般在做预测时,随机性的影响越小越好,这样预测的不确定性更少,预测更有说服力。

(2)统计模型预测

这里的统计模型指的是因果模型,比如回归模型等统计模型。这些模型本质上是在确认需要预测的指标与几个已知指标的相关性后,依赖这些与预测指标有关系的已知指标进行的预测分析。首要前提是确认已知指标与预测指标是显著相关的,这需要做相关性检验等先验检验。确认后,利用这些已知指标,再去推测未知预测指标的情况。这种预测出来的结果比较确定,且可以计算出范围偏差。

(3)指标拆解预测

搭建的指标体系在这个时候也会派上用场。举个简单的例子,贷款量=有贷人数×人均贷款金额,我们找到业务了解未来公司的运营路线,得知未来要做拉新策略,会大幅提高有贷人数,幅度大约是20%,但人均贷款金额会下降,大概下降个10%,那么按照上面指标体系的公式,带进去也可以计算出未来指标的情况。

(4)机器学习预测

实际上对于企业的数据分析部门,机器学习是一个效果可能最好,但并不常用的方法,因为我们实际在做预测的时候,不仅需要预测出对应的值或范围是多少,准确性如何,也要清楚做出这样预测的原因,比如老板一般会问:“下个季度我们的业绩大概怎样?为啥是这样?”,而机器学习在力求准确性的时候,可能会丧失一定的可解释性,因此在这个问题的取舍上,一般数据分析部门不太愿意采用机器学习这一可能是最准确的预测方案。

指标预测注意点

(1)无法做到100%准确

预测永远不可能完全准确,就算真做到了也很有可能是运气原因,但是预测还需要做的原因是因为它提供了一个方向,这个意义比预测准确性更有价值。

(2)预测需要大量数据支撑

巧妇难为无米之炊,指标预测也如此,当数据量不足的时候,什么方法都难以预测未来的走势,因为证据不足,无法推断。我们预测一定要讲究从证据出发推到结论,而不能想当然,数据预测分析的证据,当然就是数据,数据量不够是不能轻易下结论的,不能凭经验行事。

(3)预测完要持续跟进

预测完的结果,业务是否同意采纳、后续是否按照预测发展、如何纠偏等等,这些也是数据分析师需要持续跟进的,而不是预测完就撒手了事,因为如果后续你的预测结果带来了不尽如人意的效果,反而会被业务跑回来再来质疑,这些本身就是数据预测需要完成的步骤。指标预测不仅仅是预测本身,还需要关联到预测的原因是否合理、预测的结果是否有效等等。

参考资料

【数据分析思维】数据分析中预测分析应该怎么做?
预测模型,怎么做才够精准

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值