目录
转载1:https://mp.weixin.qq.com/s/gEHs2MWgBFn70StSmJD2tQ
转载2:WX公众号《阿狸与小兔》
1、破题能力
这里要强调的第一条原则也是最重要的原则:与需求方明确统计口径,是数据分析最基本的素养。
怎样估算北京市餐馆的数量?
餐馆的范围是哪些?无门店的外卖和街边摊大排档算吗?北京范围是哪些?城六区还是五环内还是行政区划都算?(城市范围的口径问题下同)
怎样估算深圳市学生的数量?
学生的范围是哪些?幼儿园、大学生算吗?还是只算九年义务教育阶段的在校生?
2、框架与逻辑
费米估算是有逻辑套路的。我们从需求端、供给端、供需端三个方面给出案例。
============================
需求端
============================
顾名思义,需求端就是从用户需求的角度出发,去计算市场的大小。常见的应用案例包括:
“全中国一年需要消费多少猪肉?”
“上海每天卖多少豆浆?”
……
我们以“全中国一年要消费多少猪肉”为例,看一下这类问题如何解答。
【STEP1】:我们将全中国一年消耗的猪肉量进行【初步】拆解,拆成以下的公式1:
公式1:全中国一年的猪肉消费量=每天消费猪肉量*全国人数*一年的天数
有人会说,年龄、生活水平等等都会影响到每天吃的肉量啊。那请注意下回归我们面试的本质:不是为了最终的答案,是为了考察你的逻辑!只要拆解逻辑流畅,自然能够获得面试官的认可。那我们先看下最简单的拆解下,应该如何计算。
在拆解公式中,全国人数、一年天数是已知的,那未知数据便是每天消费的猪肉量了。
【STEP2】:判断初级公式中数据是否已知,若仍有数据未知,继续拆!得到公式2:
公式2:每天消费的猪肉量=每天消耗的肉量*猪肉在肉类食材中的占比
联想自己:一份辣椒炒肉能够干掉一餐米饭,结合买菜经验,我一餐的肉量(注意,是肉量,不是猪肉量)约100G。在这里联想一下在西餐店吃牛排,一块牛排的重量约100G-120G。那么可以更加确信的得到:
每天消耗的肉量=100G*2餐=200G
再仔细思考:肉类=猪肉+牛羊+鸡鸭+水产+……,而猪肉是大部分最常食用的肉类,那大胆的给出估算:我认为猪肉在肉类食材中的占比约为50%!继续计算:
每天消费的猪肉量=每天消耗的肉量*猪肉在肉类食材中的占比
=200G*50%=100G
【STEP3】:数据整合,代入公式计算最终结果
我们把拆解的公式合并一下,得到公式3:
公式3:全中国一年的猪肉消费量
=每天消费猪肉量*全国人数*一年的天数
=每天消耗的肉量*猪肉在肉类食材中的占比*全国人数*一年的天数
=200G*50%*14亿*365天=5110万吨
随手在咨询报告截图中国猪肉消费增长走势,如下:
EMMM,在我们粗略的估算下,发现数量级对得上(笑哭,都是百万吨级别)。其实用公式拆解的套路来推算费米问题时,最终的答案结果是否准确真的一点也不重要,面试官看重的,就是你有没有拆解复杂问题的逻辑。
【STEP4】:思路优化与升级
当然咯,肯定还会有人不满足于这种简单的拆分,还想更加细致,可以从下面的角度来考虑:
市场调查:有人说以自己吃肉的标准来评估全国肯定不准确,那这是你可以在描述数据的时候,替换成:采用问卷访谈形式,取了被调查人食肉的中位数,发现人均每餐食肉量约100G,猪肉占比50%。
市场细分:也有人提出来,全国14亿人口,34个省级行政区,肯定有不同的食肉标准。那可以再继续市场细分,比如考虑区域、考虑年龄。
比如说从区域的角度进行细分,上面的公式1可以拆解为
全中国一年的猪肉消费量
=每天消费猪肉量*全国人数*一年的天数
=(西北地区每天消耗的肉量*西北地区猪肉在肉类食材中的占比*西北人数*365天)
+(南方沿海地区每天消耗的肉量*南方沿海地区猪肉在肉类食材中的占比*南方沿海人数*365天)
+(其他地区每天消耗的肉量*其他地区猪肉在肉类食材中的占比*其他人数*365天)
-
XX地区每天消耗的肉量可以围绕100G/餐上下浮动;
-
XX地区的人数则可以根据中国西北地广人稀的特征,随便给出估算比例,比如假设西北人数为2亿人,南方沿海2亿人,其他地区10亿人。
最后把西北、南方沿海、其他地区的估算值分别算出来后加总即可。
=========================================
供给端
=========================================
顾名思义,供给端就是从企业的供给能力出发,评估企业能够支持多大的市场规模,从供给端的角度可以考虑下面的问题:
“楼下星巴克一年卖咖啡收益?”
“北京市每天多少人乘坐地铁?”
……
我们来看看第一个问题:楼下星巴克一年卖咖啡收益?
【STEP1】:万年第一步,初步拆解公式
公式1:星巴克一年营业额=一杯咖啡均价*每天卖出咖啡数量*365天
在拆解公式里,一杯咖啡的均价是已知的,但是每天卖出咖啡的数量是未知的。所以下一步要想办法计算出每天卖出咖啡的数量。
【STEP2】:找到供给能力的瓶颈
Emmm……根据我们的常识,其实也可以判断,饮料店的点单、收银虽然需要排队,但绝不是供给能力的瓶颈问题,星巴克的瓶颈在于制作咖啡的流程,每一杯咖啡需要2分钟的制作时间。(以上数字纯属瞎诌……可自行任意假设……)
【STEP3】:继续拆公式
(以下数字也是瞎诌……自行理解逻辑即可……)
根据供给实际情况,我们考虑忙时和闲时两种情况
在星巴克忙碌(早8点-10点,午1点-3点,共计4小时)的时候,产能达到极限;而在闲暇(早10点-午1点,午3点-晚8点,共计8小时)的时候,产能非常宽松。我们继续拆解得到公式:
公式2:每天卖出的咖啡数=忙时产能+闲时产能
假设①:星巴克有2台咖啡机,每台咖啡机可以同时制作2杯咖啡,那么一家咖啡店可以同时制作4杯咖啡。
假设②:忙时设备利用率100%,闲时设备利用率20%
计算忙时产能:两分钟4杯咖啡->平均每分钟两杯咖啡->共计480杯咖啡
计算闲时产能:设备利用率为20%->平均每分钟生产0.4杯咖啡->共计192杯咖啡
【STEP4】:数据整合,得到最终结果
公式3:星巴克一年营业额
=一杯咖啡均价*(每天闲时产能+每天忙时产能)*365天
=30*(480+192)*365
=736 万
好啦,就这样能够从供给端出发计算星巴克的销量啦,根据相似的方法,你可以动笔计算一下北京市每天多少人乘坐地铁。
=========================================
供需结合
=========================================
利用供需结合的方式来进行估算是最简单的方式,可以分为【以小见大】和【以大见小】两种方法。
以小见大
“香港有多少个自助提款机?”
被面试的学生来自港中文大学,知道港中文约有10000名师生,有5台ATM取款机。
在【供给与需求满足一定比例】的假设下,推测一台ATM机能够满足2000人的取款需求。
全香港大概有700万人口,需要3500台ATM机
以大见小
“XX县城有多少金融行业从业人员?”
作出假设:全国大概800W金融行业从业人员
在【供给与需求满足一定比例】的假设下,800W金融从业人员服务与14亿中国人,1个金融从业人员可以服务175人。
XX县城的金融从业人员数量=XX县城总人数/175
从面试官的角度来说,只要在一定的框架之下,把问题分解为易估或常识数据,同时假设与逻辑能够自圆其说,就是一个合格的回答。与此同时,作为面试官我还希望看到这些加分项:
了解有哪些假设缺陷,例如上述对理发师数量估算中,其中一个假设是男女剪发周期相同,这里可能存在缺陷,如果能够分情况讨论男女客户剪发需求估算会更准确
了解有哪些分布缺陷,例如上述对学生数量估算中,人口按年龄平均分布是不合理的,按1个学生对应2个家长的假设,估算的学生数量大约需要再折半计算
保守估算和激进估算能力,对每个估算的参数,知道自己的方法得到的结果应该是一个上界还是下界
多方法Double check的意识,如上述对学生数量的估算,每个问题至少能提出2种及以上估算方法进行交叉验证
3、发散思维
假设所有数据开放,会去找哪些数据源?有哪些计算或估算方法?
这个问题的主要目的是进一步考察发散思维,因为在实际的工作过程中,手头有很多工具可以触及很多数据源,怎样筛选数据源或打开思路找数据源,也是数据分析一个重要的能力;合理的数据源越多,越能接近问题的真相。
估算北京市(全行政区划)餐馆(门店)的数量?
还是以上面这个问题为例,我收到过的回答就有:
官方数据源:国家统计局、工商局餐饮类营业执照……
互联网企业数据源:美团点评数字、地图采样统计、招聘网站招聘方……
产业链上下游:盐的消耗量、可出租商铺量……
4、相关题目
(1)估算永和豆浆一年的油条销量?
(2)上海理发店有多少tony老师?
(3)长沙一年的燃油税费是多少?(这是我面网易考拉的原题)