最近准备面试数据分析,记录一下学习的过程。很多都是从博文、公众号上整理来的,只是为了督促自己整理、输出。
提问方式
- 如果告诉你GMV(商品交易总额)同比下降20%,怎么分析?
- 日活跃人数同环比下降了15%,怎么用数据分析得到原因?
- 转化率同比下降15%,会从哪些角度考虑?
类似的提问:分析GMV、日活、转化率、客单价、跳转率、CPC、毛利率等指标波动的原因。
模板
对于这类分析异常指标变化的原因,大致可分为一下三个步骤:
Step1:验证数据的准确性
遇到大幅度的数据变动时,作为数据分析师,采取的第一步行动是验证数据的准确性,很多时候由于底表数据质量问题导致数据失误,不需要上升到分析阶段。
Step2:在排除数据自身错误的情况下,展开多维度分析。
这里主要介绍人货场思维。
从人货场三个维度,能够在绝大多数的业务背景下,相对全面并且有逻辑的列举出影响因素。针对每一个可能影响最终结果的因素进行一一验证,拆分人货场。
实例
例1:商品销售总额(GWM)同比下降20%。
Step1:验证数据的准确性
遇到大幅度的数据变动时,作为数据分析师,采取的第一步行动是验证数据的准确性,很多时候由于底表数据质量问题导致数据失误,不需要上升到分析阶段。
Step2:在排除数据自身错误的情况下,展开多维度分析。
(1) 从人的角度,考虑新老客户、不同地区的客户、不同渠道的客户、是否VIP、不同获取方式的客户。
通过数据一一验证。例如,若数据表明,新客户带来的GMV同比下降25%,但是老客户带来的GMV同比上升了1%,则可将原因定位在新客户上,推测是否是拉新活动失败,导致新用户下单减少。若数据表明h5渠道GMV同比减少了70%,需验证h5端是否能够正常的提交订单。
(2) 从货的角度,不同品类、不同价位、不同商家
通过数据一一验证。例如,若数据表明,去年连衣裙品类产品的GMV占整体GMV比例高达40%,但是GMV同比下降了30%,推测可能是连衣裙品类表现不佳,导致整体GMV下滑严重。
若发现一批去年同期活跃,产量较高的商家,今年没有上架产品,推测可能是商家维护、商家合作政策的变动,需要具体评估后考虑是否追回这批商家。
(3) 从场的角度(企业内部活动、行业整体表现)
通过数据进行验证。例如,若数据表明去年同期活动数量较多且GMV较高,而今年没有开展此类活动,则可能是活动的影响。
例2:活跃用户变化原因:日均活跃用户数量 (Daily Active User)
Step1:验证数据的准确性
遇到大幅度的数据变动时,作为数据分析师,采取的第一步行动是验证数据的准确性。很多时候由于底表数据质量问题导致数据失误,不需要上升到分析阶段。
Step2:在排除数据自身问题的情况下,展开多维度分析:
(1) 从人的角度(新老用户、不同地区的用户、不同渠道的用户、是否VIP、不通过获取方式的用户)
通过数据进行验证。例如,若数据表明活跃的新用户下降了15%,而活跃的老用户上升了5%,则可将问题定位到新用户上,推测可能是拉新活动失败。接下去,新用户主要来源于12345这5个渠道,通过渠道拆分,就可以将问题定位到具体的某个渠道上。
(2) 从货的角度(不同品类、不同价位、不同商家)
通过数据进行验证。例如,若数据表明
(3) 从场的角度(企业内部活动、平台(PC、IOS、安卓)、APP改版、行业整体表现)
通过数据进行验证。例如,若数据表明去年同期活动较多且用户活跃量较多,而今年同类活动较少,则可推测是否是因为活动。例如,今年疫情大环境下,导致许多旅游类APP用户活跃度明显减少,则可推测是疫情的影响。例如,若昨天突然进行了一次较大的APP改版,则推测是不是APP改版导致许多用户不习惯。例如,若数据表明是PC端的用户活跃数量明显下降,则对标其原因。