【数据分析】费米问题

 

目录

1、破题能力

2、框架与逻辑

需求端

供给端

供需结合

3、发散思维

4、相关题目


转载1:https://mp.weixin.qq.com/s/gEHs2MWgBFn70StSmJD2tQ

转载2:WX公众号《阿狸与小兔》

 

1、破题能力

这里要强调的第一条原则也是最重要的原则:与需求方明确统计口径,是数据分析最基本的素养。

怎样估算北京市餐馆的数量?

餐馆的范围是哪些?无门店的外卖和街边摊大排档算吗?北京范围是哪些?城六区还是五环内还是行政区划都算?(城市范围的口径问题下同)

怎样估算深圳市学生的数量?

学生的范围是哪些?幼儿园、大学生算吗?还是只算九年义务教育阶段的在校生?

 

 

2、框架与逻辑

费米估算是有逻辑套路的。我们从需求端、供给端、供需端三个方面给出案例。

============================

需求端

============================

       顾名思义,需求端就是从用户需求的角度出发,去计算市场的大小。常见的应用案例包括:

       “全中国一年需要消费多少猪肉?”

       “上海每天卖多少豆浆?”

          ……

       我们以“全中国一年要消费多少猪肉”为例,看一下这类问题如何解答。

【STEP1】:我们将全中国一年消耗的猪肉量进行【初步】拆解,拆成以下的公式1:

       公式1:全中国一年的猪肉消费量=每天消费猪肉量*全国人数*一年的天数

       有人会说,年龄、生活水平等等都会影响到每天吃的肉量啊。那请注意下回归我们面试的本质:不是为了最终的答案,是为了考察你的逻辑!只要拆解逻辑流畅,自然能够获得面试官的认可。那我们先看下最简单的拆解下,应该如何计算。

      在拆解公式中,全国人数、一年天数是已知的,那未知数据便是每天消费的猪肉量了。

【STEP2】:判断初级公式中数据是否已知,若仍有数据未知,继续拆!得到公式2:

       公式2:每天消费的猪肉量=每天消耗的肉量*猪肉在肉类食材中的占比

       联想自己:一份辣椒炒肉能够干掉一餐米饭,结合买菜经验,我一餐的肉量(注意,是肉量,不是猪肉量)约100G。在这里联想一下在西餐店吃牛排,一块牛排的重量约100G-120G。那么可以更加确信的得到:

       每天消耗的肉量=100G*2餐=200G

       再仔细思考:肉类=猪肉+牛羊+鸡鸭+水产+……,而猪肉是大部分最常食用的肉类,那大胆的给出估算:我认为猪肉在肉类食材中的占比约为50%!继续计算:

        每天消费的猪肉量=每天消耗的肉量*猪肉在肉类食材中的占比   

                                   =200G*50%=100G

【STEP3】:数据整合,代入公式计算最终结果

       我们把拆解的公式合并一下,得到公式3:

       公式3:全中国一年的猪肉消费量

      =每天消费猪肉量*全国人数*一年的天数

      =每天消耗的肉量*猪肉在肉类食材中的占比*全国人数*一年的天数

      =200G*50%*14亿*365天=5110万吨

      随手在咨询报告截图中国猪肉消费增长走势,如下:

      EMMM,在我们粗略的估算下,发现数量级对得上(笑哭,都是百万吨级别)。其实用公式拆解的套路来推算费米问题时,最终的答案结果是否准确真的一点也不重要,面试官看重的,就是你有没有拆解复杂问题的逻辑。

【STEP4】:思路优化与升级

       当然咯,肯定还会有人不满足于这种简单的拆分,还想更加细致,可以从下面的角度来考虑:

      市场调查:有人说以自己吃肉的标准来评估全国肯定不准确,那这是你可以在描述数据的时候,替换成:采用问卷访谈形式,取了被调查人食肉的中位数,发现人均每餐食肉量约100G,猪肉占比50%。

      市场细分:也有人提出来,全国14亿人口,34个省级行政区,肯定有不同的食肉标准。那可以再继续市场细分,比如考虑区域、考虑年龄。

     比如说从区域的角度进行细分,上面的公式1可以拆解为

    全中国一年的猪肉消费量

    =每天消费猪肉量*全国人数*一年的天数

    =(西北地区每天消耗的肉量*西北地区猪肉在肉类食材中的占比*西北人数*365天)

     +(南方沿海地区每天消耗的肉量*南方沿海地区猪肉在肉类食材中的占比*南方沿海人数*365天)

     +(其他地区每天消耗的肉量*其他地区猪肉在肉类食材中的占比*其他人数*365天)

  • XX地区每天消耗的肉量可以围绕100G/餐上下浮动;

  • XX地区的人数则可以根据中国西北地广人稀的特征,随便给出估算比例,比如假设西北人数为2亿人,南方沿海2亿人,其他地区10亿人。

        最后把西北、南方沿海、其他地区的估算值分别算出来后加总即可。

 

=========================================

供给端

 =========================================

顾名思义,供给端就是从企业的供给能力出发,评估企业能够支持多大的市场规模,从供给端的角度可以考虑下面的问题:

“楼下星巴克一年卖咖啡收益?”

“北京市每天多少人乘坐地铁?”

 ……

我们来看看第一个问题:楼下星巴克一年卖咖啡收益?

【STEP1】:万年第一步,初步拆解公式

公式1:星巴克一年营业额=一杯咖啡均价*每天卖出咖啡数量*365天

在拆解公式里,一杯咖啡的均价是已知的,但是每天卖出咖啡的数量是未知的。所以下一步要想办法计算出每天卖出咖啡的数量。

【STEP2】:找到供给能力的瓶颈

Emmm……根据我们的常识,其实也可以判断,饮料店的点单、收银虽然需要排队,但绝不是供给能力的瓶颈问题,星巴克的瓶颈在于制作咖啡的流程,每一杯咖啡需要2分钟的制作时间。(以上数字纯属瞎诌……可自行任意假设……)

【STEP3】:继续拆公式

(以下数字也是瞎诌……自行理解逻辑即可……)

根据供给实际情况,我们考虑忙时和闲时两种情况

在星巴克忙碌(早8点-10点,午1点-3点,共计4小时)的时候,产能达到极限;而在闲暇(早10点-午1点,午3点-晚8点,共计8小时)的时候,产能非常宽松。我们继续拆解得到公式:

公式2:每天卖出的咖啡数=忙时产能+闲时产能

假设①:星巴克有2台咖啡机,每台咖啡机可以同时制作2杯咖啡,那么一家咖啡店可以同时制作4杯咖啡。

假设②:忙时设备利用率100%,闲时设备利用率20% 

计算忙时产能:两分钟4杯咖啡->平均每分钟两杯咖啡->共计480杯咖啡

计算闲时产能:设备利用率为20%->平均每分钟生产0.4杯咖啡->共计192杯咖啡

【STEP4】:数据整合,得到最终结果

 公式3:星巴克一年营业额

    =一杯咖啡均价*(每天闲时产能+每天忙时产能)*365天

             =30*(480+192)*365

             =736 万

      好啦,就这样能够从供给端出发计算星巴克的销量啦,根据相似的方法,你可以动笔计算一下北京市每天多少人乘坐地铁。

 

=========================================

供需结合

=========================================

利用供需结合的方式来进行估算是最简单的方式,可以分为【以小见大】和【以大见小】两种方法。

 

以小见大

“香港有多少个自助提款机?”

被面试的学生来自港中文大学,知道港中文约有10000名师生,有5台ATM取款机。

在【供给与需求满足一定比例】的假设下,推测一台ATM机能够满足2000人的取款需求。

全香港大概有700万人口,需要3500台ATM机

 

以大见小

“XX县城有多少金融行业从业人员?”

作出假设:全国大概800W金融行业从业人员

在【供给与需求满足一定比例】的假设下,800W金融从业人员服务与14亿中国人,1个金融从业人员可以服务175人。

XX县城的金融从业人员数量=XX县城总人数/175

 

 

从面试官的角度来说,只要在一定的框架之下,把问题分解为易估或常识数据,同时假设与逻辑能够自圆其说,就是一个合格的回答。与此同时,作为面试官我还希望看到这些加分项:

了解有哪些假设缺陷,例如上述对理发师数量估算中,其中一个假设是男女剪发周期相同,这里可能存在缺陷,如果能够分情况讨论男女客户剪发需求估算会更准确

了解有哪些分布缺陷,例如上述对学生数量估算中,人口按年龄平均分布是不合理的,按1个学生对应2个家长的假设,估算的学生数量大约需要再折半计算

保守估算和激进估算能力,对每个估算的参数,知道自己的方法得到的结果应该是一个上界还是下界

多方法Double check的意识,如上述对学生数量的估算,每个问题至少能提出2种及以上估算方法进行交叉验证

 

 

3、发散思维

假设所有数据开放,会去找哪些数据源?有哪些计算或估算方法?

这个问题的主要目的是进一步考察发散思维,因为在实际的工作过程中,手头有很多工具可以触及很多数据源,怎样筛选数据源或打开思路找数据源,也是数据分析一个重要的能力;合理的数据源越多,越能接近问题的真相。

估算北京市(全行政区划)餐馆(门店)的数量?

还是以上面这个问题为例,我收到过的回答就有:

官方数据源:国家统计局、工商局餐饮类营业执照……

互联网企业数据源:美团点评数字、地图采样统计、招聘网站招聘方……

产业链上下游:盐的消耗量、可出租商铺量……

 

4、相关题目

(1)估算永和豆浆一年的油条销量?

(2)上海理发店有多少tony老师?

(3)长沙一年的燃油税费是多少?(这是我面网易考拉的原题)

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值