数据分析

作者:米妮老师
链接:https://www.zhihu.com/question/23946233/answer/370725097
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
1.数据分析,商业分析

Google内部有三类技术岗位(job ladder)。问题提到的三个职位分别从属于这三类技术岗位:

  • Data Engineer顾名思义,是软件工程师(software engineer)的一种。这类工程师做的事情其实非常直白,就是把产品本身产生的原始数据记录进数据库,然后把在数据库里把这些原始数据成表格。举个简单的例子,知乎上每一个用户的行为,包括搜索问题、点击回答、点赞,等等,都需要工程师通过写javascript把这些行为数据存进服务器里,然后存成一个表格记录下来每一天,每一秒,每一个用户做了什么动作。
  • Data Scientist在Google被称作quantitative analyst,翻译过来大概类似于量化分析师。这类职位比较特殊,是一种非常technical、对学术能力要求非常高的职位。这类职位99%的同事都是统计或者数学的phD,一般人听不懂他们在说什么~ 根据我个人的了解,他们的大部分工作是分析 Google Search的增长。搜索是Google最核心、最赚钱的产品,我们希望更多人用我们的搜索,更多的人能够和搜索结果互动。Data Scientist解决的问题就是,如果我们对搜索的排序做一些改动,如何通过统计学的方法精确测量这个改动对搜索整体带来的影响。这个影响往往是非常小的(Google 1天平均10亿次搜索,这个量级上的任何改动都是至关重要的)。
  • Data Analyst在Google被称作商业分析师(business analyst)或者是产品分析师(product analyst)。这个职位的作用是沟通产品和商业的桥梁,服务对象一般是产品经理以及高层领导。Data Analyst首先会把工程师维护的数据进行ETL(extract, transform, load),也就是传说中的跑数据(大多用SQL)。随后Data Analyst会把这些提取出的数据转化为“生产力“,也就是能够指导商业或者产品的建议。工作场景:产品经理上线了一款产品,这款产品运行的怎么样?有多少人访问?有多少人购买?购买人数始终上不去是什么原因?如何发掘购买人数降低的原理然后针对这些原因进行有目的的处理?这些都是通过分析产品产生的数据得到的。

在硅谷的其他科技公司,这三类职位的叫法会有一些区别。比如在Facebook的Data Scientist分成两种方向(track),一种是Research track,就是我们上面讲的Data Scientist。另一种是Product Analytics track,就是我们上面讲的Business/Product Analyst。

2. 为产品找到完美指标

引用某管理学大师的名言:如果你不能衡量它,那么你就不能有效增长它。

商业分析师在面试中经常会被问到如下问题:你会给产品定义什么样的成功指标(success metric)?

在Google内部,任何一个产品是有明确的绩效考察,也就是所谓的KPI,也就是我们这里说的成长指标。能否按期完成这个指标,关系着用户对Google的信心,老板们的心情,和基层干部的升官发财。既然指标这么重要,那么什么是一个好的指标的必要条件呢?


好的指标衡量商业价值


对电商,商品购买总额(Gross Merchandise Volume,简称GMV)是个非常显然的成长指标。因为所有电商无一例外的只有一个目的,就是靠多卖东西来赚钱。相比之下,其他指标例如用户留存率(Retention Rate)虽然重要,但是对电商来说绝对不是最重要的。


然而对于社交功能的产品,比如Facebook,微信等等,每日活跃用户数量(Daily Active User, 简称DAU)非常重要,因为这些产品存在的意义就是成为人们每天社交、打发时间的工具。这些社交功能的产品的收入模式也是以大量用户长时间、高频率的使用为前提的。Facebook 通过贩卖用户的注意力来卖广告,微信则是通过贩卖用户在平台上的粘性来创造附加收入。

<img src="https://pic1.zhimg.com/v2-7b0424fbe3901b3dfb30507391afba57_b.jpg" data-size="normal" data-rawwidth="960" data-rawheight="684" class="origin_image zh-lightbox-thumb" width="960" data-original="https://pic1.zhimg.com/v2-7b0424fbe3901b3dfb30507391afba57_r.jpg"/</noscript alt="">

日活量(daily active user). Source: Statista

但是对于另外一些企业,这个指标(日活量)很有可能根本就不靠谱。我们可以看看LinkedIn的例子。

如果你是LinkedIn的老板,你可能根本不会去关心网站的日活量。为什么呢?LinkedIn靠什么赚钱?这个产品赚钱不是靠流量,靠的是拥有完整profile的用户的数量。只有这类用户的数量多了,猎头和招聘公司才会纷纷赶到,LinkedIn才有钱赚。

所以,如果我是LinkedIn的老板,我会把公司的成功指标设定为“拥有完整profile 的用户的数量”。所以,在面试中面对此类问题,我们一定要想清楚此产品到底靠什么赚钱,哪一个指标最能反映产品创造的价值。


好的指标只有一个

在Google,我们对每个产品都会找一个“北极星”指标。顾名思义,这个指标就应该像北极星一样,永远指引着产品团队行朝着最大化这个指标的方向前进。确定就好一个北极星指标,只要这个指标反映了产品的本质商业价值,那么团队就可以专注于产品长期的增长。

互联网流传着这么一个被使用到烂的框架:AARRM。这5个字母分别代表了用户在产品内部的生命周期。做数据分析的同学们,所有的App(甚至所有互联网产品)都可以参考这个框架来思考如何选取北极星指标。

  • Acquisition:用户获取。网站注册用户,移动应用装机数量。产品增长的第一步。这个非常直白,不用多说。
  • Activation:用户激活。传说中的“用户第一次体验到产品美妙“的时刻。在这里我们需要定义怎样才算作是“用户激活”。比如Facebook前期对激活的定义,就是拥有至少7个好友的用户数量。通过数据分析,Facebook团队发现如果新注册用户加了7个好友,该用户的留存率会大大提高。这个靠谱,因为Facebook给用户提供的核心价值就是和朋友社交。只有用户被激活,我们才认为用户真正开始使用了产品提供的价值。
  • Retention:用户留存。用户粘性。来的快,去得也快。只关注新增用户、不关注流失用户的商业分析不是好的商业分析。主要的指标就是留存率(Retention Rate)。具体的计算方法呢?4月1号当天新增了100个用户,如果这100个用户里在之后的第30天还活跃,那么我们说4月1号那天的用户留存率是30%。
  • Revenue:用户变现。又到了收割的季节。这里可以是用户直接掏钱购买商品或服务,也可以是产品通过用户流量进行套现。可用的指标:GMV(商品销售总额)、购买人数、用户平均消费(Average Revenue per User,简称ARPU)、买家平均消费(Average Revenue per Paying User,简称ARPPU)。
  • Referral:用户自传播。病毒式传播。我们可以通过计算平均每个已有用户邀请来的新用户作为主要指标。

再举个工作中的例子。在分析A/B测试结果的时候,产品经理有时候会关注10个不同的指标。作为商业分析师,就算其他9个指标都是上升,只要北极星指标下降,同学们也应该毅然否定这个测试结果,并花更多时间去研究为什么北极星指标会下降。


好的指标定义简单

好的指标一般来讲需要一个非常简单明了的定义,既直观(容易向别人解释),也可靠(便于自己测量)。给一个电商找指标,商品交易总额(GMV)还是投资回报率(Return on Investment, 简称ROI)?应该是GMV,因为他直白,他好计算。

有同学会问:难道不用考虑电商的经营成本,比如货物成本、运输成本之类的么?这个是完全正确的。但是在真实工作和面试中,如果把所有的因素都考虑进来,那么问题的维度会变得非常的繁杂,对指标的定义也就变得非常困难。所以,我们在这里需要遵循2-8法则(用80%的经历放在20%最重要的部分上),抓住重点。

我们一定要想清楚此产品到底靠什么赚钱,哪一个指标最能反映产品创造的价值。

补充:不同公司类型需要考虑不同指标,不同发展阶段也需要区分。

3.case study&分析框架

ABC公司主营在网上卖床垫。我们发现12月份比11月份购买床垫的顾客数量下降了10%。怎么回事?

小张的回答:

呵呵,我随便举几个:经济不好,购买欲望变低;产品质量出了问题,顾客满意度下降;嗯,还有可能是之前的促销结束了,所以卖的没有之前的多。可能还有别的,我一时半会儿想不起来了,您别见怪。

小王的回答:

我打算从这几个方面分析原因。首先,今年12月与去年同期相比是否正常?整体行业是否处于下降?... 排除外部原因后,我会先对销售的环节进行切分,找出下降的原因:是否网站访客数量下降?是否购物车用户数量下降?... 假设我们法案购物车用户数量下降,我会接下来对这部分用户根据地区、使用年龄、所购商品进行再次切分,找出下降尤为严重的客户群体...

这么对比,两人的分析能力高下立见。第一个回答依赖经验和直觉(intuition),中间存在很多逻辑的跳跃。第二个答案则以逻辑来推导,运用了结构化的框架(structured framework),也就是我们常说的“套路”。

什么是好的分析框架(framework)

MECE,读作Me-See,全称Mutually Exclusive Collectively Exhaustive,中文意思是相互独立,完全穷尽。



简单来说,要做到MECE,你给出的假设要满足两点:

  • 假设之间互相没有交集。比如,假设A(美国用户购买下降)和假设B(老年用户购买下降)就不满足这个原则,因为一定有很多用户都是美国老人。
  • 所有的假设涵盖了所有情况。同样上面的两个假设就不满足这个原则。日本的年轻人怎么办?


原理上简单,但是实际上我们很难完美操作:对行业了解不足、对产品认识不全面、需要短时间快速思考,这些因素都会阻碍思维,做不到MECE。


是啊,想想就头大:影响顾客作出购买决定的原因这么多,到底是什么因素可能导致购买用户的数量下降?卖床垫还好比较简单,万一是像Google这种不直接向用户销售产品的公司呢?或者是像Uber这种平台型(two-sided platform)公司呢?


那么,问题来了:如何在最短时间内、对公司业务没有了如指掌的情况下,有调理地、有说服力地、不假思索地对问题分析的全面且到位?


为你的框架找一个公式(formula)


好消息!绝大多数公司的商业模式,都可以抽象成一连串的公式:


  • 利润 (profit) = 销售额(revenue)- 成本(cost)
  • 销售额 = 购买人数 * 转化率 * 客单价
  • 购买人数 = 美国购买人数 + 日本购买人数+ ……
  • 美国购买人数 = 美国购买商品A的人数 + 美国购买商品B的人数 + ……


此类公式根本不难,可99%的此类面试题都可以用公式化的套路概括。因为商业价值本身就是在用户做出一系列动作之后实现的,在实际工作中我们的确是通过分析这其中每一个动作产生的数据来“推测”用户最后没有完成购买的原因,然后针对这个原因对产品进行改进。



床垫问题的参考答案


对于我们的床垫问题,我们可以在脑中依照如下漏斗(funnel)迅速构思出以下公式:



我们把它写成一个等式:

  • 商品购买人数 (buyer)= 网站访问人数 (homepage) * 搜索商品的比例 (view category) * 点击商品页面的比例 (view product) * 将商品放入购物车的比例 (add to basket) * 点击下单的比例 (checkout)


是不是很简单?

这时,你已胸有成竹,健步上前,在黑板上写下几个大字(例如:人间正道是沧桑),并作出解释:我把购买人数这个指标进行如此分解,基于这个分解我可以通过观测该公式每一项来分析,在我们用户转化(conversion)这个流程里,到底是哪个环节导致了购买用户数量的降低。

讲到这里,面试官点点头,打断了你,说道:没错,我们的确发现最后一步,也就是点击下单(checkout)的比例下降了。


然而一切已经尽在你掌中了。你不失优雅地写出如下公式:


  • 点击下单人数 = 地区A购买人数+地区B购买人数+……

所以,你会进一步对用户群体按地区进行切分,看看是哪个地区对整体点击比例下降的贡献最大。类似地,你还可以做进一步的切割:

  • 点击下单人数 = 从未购买的用户人数 + 经常购买的顾客人数 + ….
  • 点击下单人数 = 购买行军床的用户人数 + 购买席梦思的用户人数 + ...
  • ...

恭喜你,你完成了一次85%完美的case interview!


总结

我们介绍的这个框架,是对不同行业的同一种商业模式(我们这个例子是电商)的高度概括。掌握了框架, 同学们便可以用最短时间准备一大类问题。所以,只要提前把这些公式牢记于心,面试遇到这种题目同学们还会害怕吗?




  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值