哈罗python的学费多少-数据分析面试题总结

目录

vivo

一、业务方面

二、技术方面

统计学基础及算法

sql题

python

三、自我剖析

小红书

一、业务问题

二、技术问题

统计学与算法

sql

python

三、自我剖析

美团

一、业务or逻辑问题

二、技术问题

三、自我剖析

美团

一、业务问题

二、技术问题

2.1 概率论、统计学与机器学习算法

2.2 sql

2.3 python

三、自我剖析

京东

一、业务or逻辑问题

二、技术问题

概率论、统计学与机器学习算法

sql

python

三、自我剖析

哈啰

一、业务or逻辑问题

二、技术问题

三、自我剖析

主要针对数据分析的常见题型,概率与统计、业务问题、机器学习、python、个人剖析题进行总结。

vivo

主要针对业务问题和概率论与统计类问题较多

一、业务方面

微信红包和转账有啥区别?

(1)红包有限额,仅在特定节日的时候可以发大额的红包

(2)红包在没有点开之前是不会显示金额,但是转账直接可以看到金额

(3)到账时间有区别,红包24小时未接收会退回,转账不想接收可以直接退给对方

利润下降怎么分析?

点击量下降怎么分析?

新客户和老客户流失分析上有区别吗,该如何分析?

你如果是个数据分析师,那么你怎么向一些微信用户推荐新好友?

高级写字楼不允许外卖小哥进去,同时上班族也不想下楼来拿外卖,有何解决方法?

A、B两个人决定抛硬币吃苹果,谁先抛到正面谁先吃,两个人抛硬币的顺序对它们能不能吃到苹果有没有区别?

销量环比增长,但老板不满意,请分析是什么原因?

如何确定上海地铁一天的人流量

思路:分热门冷门线路,工作日、周末/节假日

工作日分早晚高峰,周末及节假日根据平均人流量计算

现在觉得可以根据一天的地铁运营总收入进行计算,总收入=人流量*平均客单价)

如果vivo要开发一款钱包产品,现在还在概念阶段,你如何利用现有数据说服老板开启这个项目?

思路:

1)需求分析:vivo本身用户画像,根据用户消费行为可以分析出用户是否需要这个场景

2)竞品分析:参考华为钱包、Applepay的消费数据,分析现有市场情况以及潜在市场

3)收入分析:假设vivo可以从每次用户的消费行为中提成,根据上面的潜在市场及用户平均消费行为分析,如果开发这个钱包,可以为vivo带来多少收入

知道辛普森悖论吗,解释一下。如何避免?

举例:某一次数据分析的整体结果显示,安卓用户的会员付费率比iOS高,但如果分iOS和安卓单独来看,其实安卓用户的会员付费率比iOS低。

如何避免:进行指标拆解,对每一个二级指标进行分析,避免被整体结果迷惑。

论证吸烟和癌症的关系?

办公楼高峰期只有2部电梯怎么办?

如何验证中医的有效性?

vivo最新款手机型号

app store需要考虑到研发方提供的收益,如何给app store的app排序兼顾收益

如何判断一张火车票是否是黄牛票?

应用商店的下载量降低,会采取什么解决方案。

对vivo现在的产品有什么了解?

对智能手机的市场有什么了解?

vivo的竞争对手都有哪些?

分析淘宝和京东的区别

如何提升微信的用户满意度

一个案例:二战中机翼中弹多 机尾少,解释为什么?

大楼里取外卖,外卖小哥不能进,保安又不让楼里的人在楼下等,如何解决?

二、技术方面

统计学基础及算法

解释一下聚类分析、回归分析、相关分析

甲乙抛硬币,甲先抛,乙后抛,谁先抛到反面谁赢,问甲赢的概率

各种算法的基础知识,特点、优缺点以及应用场景。(关键)

二项分布、泊松分布、正态分布的区别是什么?泊松分布的极限形式知道吗?

sql题

查询各班成绩排名第二的同学的成绩平均值

select avg(t. score)

from(

select *,dense_rank() over (partition by class order by score) as s_rank

from student ) t

where t.s_rank = 2;

python

python中三种典型存储方式,元组和列表的区别?

字典,元组,列表

列表是动态数组,它们不可变且可以重设长度(改变其内部元素的个数)。

元组是静态数组,它们不可变,且其内部数据一旦创建便无法改变。

元组缓存于Python运行时环境,这意味着我们每次使用元组时无须访问内核去分配内存

Python用过的库,怎么用Python做数据清洗。

三、自我剖析

做过最有挑战的事情举例

团队中,队友不配合怎么办

社团干部经历

自己的优缺点

讲一下人生规划

小红书

一、业务问题

如果某天发现后台数据指标下降,怎么分析?

对小红书想要扩展男性消费者市场有什么看法,怎么做?重新开发一个专门针对男性群体的app还是在现有app的基础上开辟专栏

平时最喜欢的app是什么,对这个app来说最重要的指标是什么,如果你为这家app的企业工作,你怎么提升app的运营情况

计算XX城市一天能够卖出多少油条?

给出一些数据,计算两个公司想要实现预期的增长规模,需要达到多少的营收

检验新功能能否增加笔记的点击,如果ABtest两组的指标上上下下怎么看

如果有俩小区 投放不同的垃圾桶数量,垃圾总量上的区别

某一天DAU新客50w老客200w,第二天新客10w,预测后1天,后7天,后28天的日活

如果机场要新增停车位,你会如何分析

小红书和别的app在用户量上会有怎样的差异?

对KOL分级你会怎么做,分析和指标

为了计算营销效果怎么确定发送短信后的统计时间范围

日活/月活这个指标有什么意义,以及对公司来说越高越好吗?微信的这个指标什么样子

估计一下上海地铁从a站进b站出的人流量

小红书和快手,抖音的异同

有没有在小红书发布过笔记

小红书的用户画像,特征工程,评估指标等,分点说

a平台的订单转化率10%,b平台的订单转化率为30%,怎么分析为什么a平台的转化率低?

如何评价淘宝双十一活动的好坏

两个活动a和b,a的人数比b少,但是a人均订单价格比b高,那么这两个活动,哪个效果比较好?

店铺运营,如何提高商品的销售额?

检验新功能能否增加笔记的点击,如果ABtest两组的指标上上下下怎么看

二、技术问题

统计学与算法

介绍一下多元线性回归的优缺点、朴素贝叶斯的优缺点

sql

两道SQL,第一道给出订单(订单id,用户id,产品id,订单金额)、用户(用户id,用户年龄)、产品(产品id,品牌)三张表,提取不同品牌产品在不同年龄段消费者人群中的平均消费金额。脑袋一片空白没写出来,只写出来给定品牌下的结果,面试官小姐姐说没有关系然后说了一下可以用左连接,之后给了第二道非常简单的,分组求top 10那种

给出一张表(订单id,用户id,商品id,消费金额,产品品类),求不同产品品类下GMV排名第三的商品id,用row_number() over()+子查询

userid starttime endtime 求间隔超过两小时的userid(思路:表userid连接,starttime和endtime相差2小时)

python

三、自我剖析

为什么选择互联网行业?

为什么选择数据分析?

对数据分析有什么看法。

三个方面,一是对指标的监控、指标异常变动时排查原因;二是ab实验分析,和产品经理对接;三是从数据中发现问题、自己要提出产品改进的意见、推进产品迭代

美团

一、业务or逻辑问题

二、技术问题

2.1 概率论、统计学与机器学习算法

2.2 sql

2.3 python

三、自我剖析

美团

一、业务问题

gmv增速降低,分析是什么原因导致

AB Testing是什么,怎么运用到我刚刚提到的场景

用户画像具体的产出

如今到店的逃单率变高了,你觉得原因有哪些

应该要回答的是,商家在这些动机上、以及逃单的意愿变强了。总结一下其实就是移动支付是主要原因,以前都是在电脑上买团购券的、现在都是到店再买

如何确定餐饮门店密度?

问题背景:

陌生城市,想通过美团app选择到店就餐。若周围5km内,店铺数量过少,用户无选择空间;若 店铺太多,其实也没意义,不会画太多时间去逐一研究。如何确定门店密度?(假设横轴为门店密度,纵轴为满意度)

面试官说自己问题问的不好,其实这个问题的症结在于——

①对于不同的用户在不同地点,周围范围的圈定;

②应分情况讨论,对于不同场景下,密度肯定不同(eg:商场、工业园区)

如果让你预测美团团购用户的流失,你怎么构造用户行为特征?

你认为美团的盈利模式是什么样子。

美团外卖和美团团购的盈利模式一样吗?

对美团业务的理解,对美团的了解

case分析题,要求答出美团买菜未来的三条策略,优劣势

水转化成石油这个专利如何定价

美团外卖和快驴商户细分

怎么估计美团在上海地区一天的订单量

评价美团点评

为商家设计电子菜单,个性化推荐菜单可以用一些什么特征

单纯按照销量来推荐热门菜会出现什么问题

利用美团点评平台的所有数据,为一个准备开店的人做出策略

二、技术问题

2.1 概率论、统计学与机器学习算法

Hypothesis testing了解吗,t-test和f-test的区别

方差分析和t检验的区别?

特征工程,怎么评判聚类结果

2.2 sql

2.3 python

三、自我剖析

怎么看待商业分析这个岗位

介绍一个做过的印象深刻的项目,为什么印象深刻

从之前的某份经历中学到了什么?拿到一个数据怎么分析?如何与业务联系?

京东

一、业务or逻辑问题

漏斗模型

问京东分为不同会员,如何从各个方面提高下单率(漏斗模型)

二、技术问题

概率论、统计学与机器学习算法

sql

hive的并行化操作,管道操作

一道sql问题,求出全部成绩>80的学生,可以用min(score)over(partition by sname)>80,就可以满足所有成绩>80,也可以用row_number()但是没有上面的简洁.

hive的字符串操作函数,窗口函数

python

用的图表,取哪些指标,数分需要哪些核心技能,python的基础知识?

map join

Python如何传参2. Python如何连数据库

静态分区和动态分区的区别

三、自我剖析

哈啰

一、业务or逻辑问题

二、技术问题

2.1 概率论、统计学与机器学习算法

1.

2.2 sql

2.3 python

三、自我剖析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值