数据分析面试题——业务思维逻辑

1. 不用任何公开参考资料,估算今年新生儿出生数量。

  • 采用两层模型(人群画像x人群转化):新生儿出生数=Σ各年龄层育龄女性数量*各年龄层生育比率
    (一般面试中采用这种方法,即费米估计问题,可以参考《这也能想到?——巧妙解答无厘头问题》)

  • 从数字到数字:如果有前几年新生儿出生数量数据,建立时间序列模型(需要考虑到二胎放开的突变事件)进行预测

  • 找先兆指标,如婴儿类用品的新增活跃用户数量X表示新生儿家庭用户。Xn/新生儿n为该年新生儿家庭用户的转化率,如X2007/新生儿2007为2007年新生儿家庭用户的转化率。该转化率会随平台发展而发展,可以根据往年数量推出今年的大致转化率,并根据今年新增新生儿家庭用户数量推出今年估计的新生儿数量。

2. 如果次日用户留存率下降了 5%该怎么分析?

  • 首先采用“两层模型”分析:对用户进行细分,包括新老、渠道、活动、画像等多个维度,然后分别计算每个维度下不同用户的次日留存率。通过这种方法定位到导致留存率下降的用户群体是谁。
  • 对于目标群体次日留存下降问题,具体情况具体分析。具体分析可以采用“内部-外部”因素考虑。
    a. 内部因素分为获客(渠道质量低、活动获取非目标用户)、满足需求(新功能改动引发某类用户不满)、提活手段(签到等提活手段没达成目标、产品自然使用周期低导致上次获得的大量用户短期内不需要再使用等);
    b. 外部因素采用PEST分析(宏观经济环境分析),政治(政策影响)、经济(短期内主要是竞争环境,如对竞争对手的活动)、社会(舆论压力、用户生活方式变化、消费心理变化、价值观变化等偏好变化)、技术(创新解决方案的出现、分销渠道变化等)。

3. 卖玉米如何提高收益?价格提高多少才能获取最大收益?

  • 收益 = 单价*销售量,那么我们的策略是提高单位溢价或者提高销售规模。
    提高单位溢价的方法:
    (1)品牌打造获得长期溢价,但缺陷是需要大量前期营销投入;
    (2)加工商品占据价值链更多环节,如熟玉米、玉米汁、玉米蛋白粉;重定位商品,如礼品化等;
    (3)价格歧视,根据价格敏感度对不同用户采用不同定价。
    销售量=流量x转化率,上述提高单位溢价的方法可能对流量产生影响,也可能对转化率产生影响。
  • 收益 = 单价x流量x转化率,短期内能规模化采用的应该是进行价格歧视,如不同时间、不同商圈的玉米价格不同,采取高定价,然后对价格敏感的用户提供优惠券等。

4. 类比到头条的收益,头条放多少广告可以获得最大收益,不需要真的计算,只要有个思路就行。

  • 收益 = 出价x流量x点击率x有效转化率,放广告的数量会提高流量,但会降低匹配程度,因此降低点击率。最大收益是找到这个乘积的最大值,是一个有约束条件的最优化问题。
    同时参考价格歧视方案,可以对不同的用户投放不同数量的广告。

5.APP激活量的来源渠道很多,怎样对来源渠道变化大的进行预警?

  • 如果渠道使用时间较长,认为渠道的app激活量满足一个分布,比较可能是正态分布。求平均值和标准差,对于今日数值与均值差大于3/2/1个标准差的渠道进行预警。
  • 对于短期的新渠道,直接与均值进行对比。

6.用户刚进来APP的时候会选择属性,怎样在保证有完整用户信息的同时让用户流失减少?

  • 采用技术接受模型(TAM)来分析,影响用户接受选择属性这件事的主要因素有:
    技术接受模型提出了两个主要的决定因素:
    ①感知的有用性(perceived usefulness),反映一个人认为使用一个具体的系统对他工作业绩提高的程度;
    ②感知的易用性(perceived ease of use),反映一个人认为容易使用一个具体的系统的程度。

(1)感知有用性:
a. 文案告知用户选择属性能给用户带来的好处
(2)感知易用性:
a. 关联用户第三方账号(如微博),可以冷启动阶段匹配用户更有可能选择的属性,推荐用户选择。
b. 交互性做好。
(3)使用者态度:用户对填写信息的态度
a. 这里需要允许用户跳过,后续再提醒用户填写
b. 告知用户填写的信息会受到很好的保护
(4)行为意图:用户使用APP的目的性,难以控制
(5)外部变量:如操作时间、操作环境等,这里难以控制

7.如何识别作弊用户(爬虫程序, 或者渠道伪造的假用户)

  • 分类问题可以用机器学习的方法去解决,下面是我目前想到的特征:
    (1)渠道特征:渠道、渠道次日留存率、渠道流量以及各种比率特征
    (2)环境特征:设备(一般伪造假用户的工作坊以低端机为主)、系统(刷量工作坊一般系统更新较慢)、wifi使用情况、使用时间、来源地区、ip是否进过黑名单
    (3)用户行为特征:访问时长、访问页面、使用间隔、次日留存、活跃时间、页面跳转行为(假用户的行为要么过于一致,要么过于随机)、页面使用行为(正常用户对图片的点击也是有分布的,假用户的行为容易过于随机)
    (4)异常特征:设备号异常(频繁重置idfa)、ip异常(异地访问)、行为异常(突然大量点击广告、点赞)、数据包不完整等

8.怎么做恶意刷单检测?

  • 分类问题用机器学习方法建模解决,我想到的特征有:
    (1)商家特征:商家历史销量、信用、产品类别、发货快递公司等
    (2)用户行为特征:用户信用、下单量、转化率、下单路径、浏览店铺行为、支付账号
    (3)环境特征(主要是避免机器刷单):地区、ip、手机型号等
    (4)异常检测:ip地址经常变动、经常清空cookie信息、账号近期交易成功率上升等
    (5)评论文本检测:刷单的评论文本可能套路较为一致,计算与已标注评论文本的相似度作为特征
    (6)图片相似度检测:同理,刷单可能重复利用图片进行评论

9.一个网站销售额变低,你从哪几个方面去考量?

  • 首先要定位到现象真正发生的位置,到底是谁的销售额变低了?这里划分的维度有:
    a. 用户(画像、来源地区、新老、渠道等)
    b. 产品或栏目
    c. 访问时段
  • 定位到发生未知后,进行问题拆解,关注目标群体中哪个指标下降导致网站销售额下降:
    a. 销售额=入站流量x下单率x客单价
    b. 入站流量 = Σ各来源流量x转化率
    c. 下单率 = 页面访问量x转化率
    d. 客单价 = 商品数量x商品价格
  • 确定问题源头后,对问题原因进行分析,如采用内外部框架:
    a. 内部:网站改版、产品更新、广告投放
    b. 外部:用户偏好变化、媒体新闻、经济坏境、竞品行为等.

10.用户流失的分析,新用户流失和老用户流失有什么不同?
(1)用户流失分析:

  • 两层模型:细分用户、产品、渠道,看到底是哪里用户流失了。注意由于是用户流失问题,所以这里细分用户时可以细分用户处在生命周期的哪个阶段。
  • 指标拆解:用户流失数量 = 该群体用户数量*流失率。拆解,看是因为到了这个阶段的用户数量多了(比如说大部分用户到了衰退期),还是这个用户群体的流失率比较高
  • 内外部分析:
    a. 内部:新手上手难度大、收费不合理、产品服务出现重大问题、活动质量低、缺少留存手段、用户参与度低等
    b. 外部:市场、竞争对手、社会环境、节假日等

(2)新用户流失和老用户流失有什么不同:

  • 新用户流失:原因可能有非目标用户(刚性流失)、产品不满足需求(自然流失)、产品难以上手(受挫流失)和竞争产品影响(市场流失)。
    新用户要考虑如何在较少的数据支撑下做流失用户识别,提前防止用户流失,并如何对有效的新用户进行挽回。
  • 老用户流失:原因可能有到达用户生命周期衰退期(自然流失)、过度拉升arpu导致低端用户驱逐(刚性流失)、社交蒸发难以满足前期用户需求(受挫流失)和竞争产品影响(市场流失)。
    老用户有较多的数据,更容易进行流失用户识别,做好防止用户流失更重要。当用户流失后,要考虑用户生命周期剩余价值,是否需要进行挽回。

11.GMV(成交总额)升了20%怎么分析?
(我噼里啪啦分析了一通面试官笑嘻嘻地告诉我是数据错了,因为面试较紧张没有意识到这个问题,现在想想真是个大坑啊)

  • 参考该面试者经验,应该先估算一下数字有没有问题
  • 同样的套路:
    (1)两层模型:进行用户群体、产品、渠道细分,发现到底是谁的GMV提升了
    (2)指标拆解:将GMV拆解成乘法模型,如GMV=广告投放数量广告点击率产品浏览量放入购物车率交易成功率*客单价,检查哪一步有显著变化导致了GMV上升
    (3)内外部分析:
    a. 内部:网站、产品、广告投放、活动等
    b. 外部:套PEST等框架也行,或者直接分析也行,注意MEMC即可
    这一题要注意,GMV流水包括取消的订单金额和退货/拒收的订单金额,还有一种原因是商家刷单然后退货,虽然GMV上去了,但是实际成交量并没有那么多。

12. 如果现在有个情景,我们有一款游戏收入下降了,你怎么分析。

  • 两层模型:细分用户、渠道、产品,看到底是哪里的收入下降了
  • 指标拆解:收入 = 玩家数量 * 活跃占比 * 付费转化率 * 付费次数 * 客单价
    进一步细分,如玩家数量 = 老玩家数量 * 活跃度 + 新玩家数量 * 留存率等。然后对各个指标与以往的数据进行对比,发现哪些环节导致收入下降
  • 原因分析:
    a. 内部:产品变化、促活活动、拉新活动、定价策略、运营策略、服务器故障等
    b. 外部:用户偏好变化、市场环境变化、舆论环境变化、竞争对手行为、外部渠道变化等
  • 如何提高:基于乘法模型,可以采用上限分析,从前往后依次将指标提升到投入足够精力(假设优先分配人力、经费与渠道)后的上限,然后分析“收入”指标的数值提升。找到数值提升最快的那个阶段,就是我们提高收入的关键任务

13. 现在有一个游戏测试的环节,游戏测试结束后需要根据数据提交一份PPT,这个PPT你会如何安排?包括什么内容?

  • 这里可以套AARRR模型:
    获取用户(Acquisition)
    提高活跃度(Activation)
    提高留存率(Retention)
    获取收入(Revenue)
    自传播(Refer)

  • 获取:我们的用户是谁?用户规模多大?
    a. 用户分层

  • 激活:游戏是否吸引玩家?哪个渠道获取的用户有质量(如次日留存高、首日停留时间长等)?

  • 留存:用户能否持续留存?哪些用户可以留存?

  • 转化:用户的游戏行为如何?能否进行转化?能否持续转化?

  • 自传播:用户是否会向他人推荐该游戏?哪种方式能有效鼓励用户推荐该游戏?传播k因子是否大于1?

14. 比如你对楼市不熟悉,现在要你去做一个像58同城之类的,卖房的中介,电商,你会如何进行分析。

(1)商业模式分析:中介做的是双边市场生意,通过解决市场信息不对称下的信息流动问题,降低买方和卖方的交易成本,从而创造盈利空间
(2)需求分析:
a. 买方需求分析:低价买好房,对时间的需求有快的和慢的
b. 卖方需求分析:房子卖高价,对时间的需求有快的和慢的
(3)进入条件分析(套SWOT分析法(态势分析法)也行):
a. 自身条件
b. 竞争对手
c. 市场增长规模
(4)进入策略分析:
a. 自身目标
b. 目标拆解
c. 分析目标达成的可能性,预估将来一段时间,好/正常/坏条件下的目标达成情况
d. 得出结论:是否进入该市场

15. 某业务部门在上周结束了为期一周的大促,作为业务对口分析师,需要你对活动进行一次评估,你会从哪几方面进行分析?
(1) 确定大促的目的:拉新?促活?清库存?
(2) 根据目的确定核心指标。
(3) 效果评估:
a. 自身比较:活动前与活动中比较
b. 与预定目标比
c. 与同期其它活动比
d. 与往期同类活动比
(4)持续监控:
a. 检查活动后情况,避免透支消费情况发生
b. 如果是拉新等活动,根据后续数据检验这批新客的质量

  • 5
    点赞
  • 64
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值