太长的sql怎么分析_不同类型的数据分析岗位(校招)的简介 & 技术面参考思路...

作者:稀饭

本文约 2950字 ,建议阅读 13分钟

1、常见的数据分析岗的类型

a523192fc0607ebc396dca5dfdb7bb67.png

2、数据分析工程师 / 大数据分析

这一类型的数据分析岗主要偏重技术,在企业中一般给的是T序列(技术 / 研发),待遇也一般是该岗位的三类中较高的。由于这类数据分析岗不可避免要写代码(不仅仅是 SQL,Python和R也需要,甚至可能需要Java、C++等),要有实现落地的能力,所以在技术面上,除掉自我介绍、个人经历 / 个人项目讨论、反问环节外,一般会有四个主要的内容:

(1)SQL。出现概率很高,中等难度。面试场景一般是两种,第一种是单点类问题,比如“join和left join的区别”,会根据你的回答进一步下钻或问下一个问题。第二种是实战类问题,会给你一个题目场景,和笔试的SQL题类似,让你在一定的时间范围内回答出来;

(2)理论知识。出现概率很高,中等难度。面试涉及的理论知识领域一般包括“统计学”、“数据库”、“机器学习”等,面试场景一般是两种,第一种是单点类问题,比如“什么是过拟合”,也是根据你的回答情况进一步下钻或问下一个问题。第二种是实战类问题,会给你一个题目场景,如“现在我们要识别一些欺诈用户,请你给一个模型及应用过程”;

(3)撕代码。出现概率一般,难度较大。某些公司的该类型的数据分析岗还会要求具有一定的工程代码的能力,考核方式一般是代码题。总体来看难度较大,但相比专门的程序员面试还是要简单一些,而且一般都会允许使用Python语言来实现;

(4)业务分析。出现概率较高,难度中等 ~ 难度较大。难度中等的业务分析题一般是单点类问题,比如“转化率下降怎么分析”,这种问题网上会有很多“标准模板”可以套。而难度较大的业务分析题一般是基于给定场景的业务问题,而且往往和所面试的企业的业务内容相关,面试官会先叙述一段实际中的业务场景,然后让你基于该业务场景做分析,较灵活。

3、数据分析师

这一类型的数据分析岗是均衡型的,业务和技术参半,技术上多半不会超过SQL + Python + R语言的组合,且一般以SQL为主,面试的难度也相对中等,岗位待遇主要和所在的序列有关,T序列的待遇会高于P序列。除掉个人相关的面试内容,技术面一般有三个部分:

(1)SQL。出现概率很高,中等难度。在SQL上与刚才提到的偏技术方向的数据分析岗位的要求差不多,因为在实际的业务中,SQL更多地还是用在数据中台里处理数据,对于分析师来说,数据处理是一个基本功,所以SQL的要求属于一个核心考查点,SQL题答的不好很可能就会被挂掉;

(2)理论知识。出现概率很高,中等难度。一般不会涉及太多的机器学习和数据库的理论知识,而会更多侧重在统计学相关的理论知识上,因为这一类型的数据分析岗位对建模能力的要求不如前一个高,很多时候只需要基本的统计学知识,比如AB测试中会用到配对样本的t检验,这个理论知识点常常是最热门的面试考点之一;

(3)业务分析。出现概率很高,难度较大。由于这一类型的数据分析岗位,业务分析的要求会被提高,所以业务分析题在面试中被提到的概率也会加大,但整体难度和形式和上一个类型的数据分析岗差不多,实战型问题会难于单点型问题。

4、数据分析 / 商业分析 / 数据产品

这一类型的数据分析岗会更偏业务一些,对代码和数理模型的要求会降低,而会更看重业务分析和业务模型(如PEST模型、RFM模型等),岗位一般会给P序列,待遇在同企业中一般会低于T序列的数据分析岗,但也不会低很多,可能相差1k-3k左右。这类数据分析岗的面试难度其实是较大的,原因包括两个,一个是面试这种类型的数据分析岗的人会比较多(不侧重技术知识,门槛相对低一点),第二个是业务分析的要求会加大一些。

除掉个人相关的部分,技术面的内容板块和第二种类型的数据分析岗差不多,但难度和侧重点都会偏向业务分析这块。

5、面试思路

由于在参加数据分析岗位面试的时候,一般情况下你是不能完全知道这个岗位究竟是上面三种类型的哪一种(给出来的名字只是一般情况,具体面你的时候得看是事业部或部门),所以应对面试的策略不应该是去猜岗位偏重的类型,而是根据面试的结构流程设计策略。

那么,数据分析岗的技术面试的结构一般是怎样的呢?首先,排除掉一些奇葩的公司设计的是群面(比如上海某个乙方数据公司),绝大多数情况下的技术面形式是单面,那么面试就会有一个大致的流程:

自我介绍 → 有面试官觉得OK的实习 / 项目经历聊一下,没有的话进行知识提问 → 反问环节

所以,面试策略其实要分两类,第一类是“有面试官觉得OK的实习 / 项目经历”,第二类是“没有面试官觉得OK的实习 / 项目经历”。注意这里有一个主观判定:“面试官觉得OK”,并不是你有“实习 / 项目经历”,面试官就一定会和你讨论,而是需要你这个“实习 / 项目经历”在ta看来是OK的,也就是有讨论的价值的,往往比较对口和实习和项目会被讨论的概率更高。

(1)有面试官觉得OK的实习 / 项目经历

在这种情况下,面试的策略应该是“尽可能地利用实习 / 项目展示理论和实践能力”。当面试官对你的“实习 / 项目经历”感兴趣的时候,这是你在面试内容上占主动的机会,因为你可以比较好地引导面试官的问题方向。所以,需要抓住这样的机会,在实习和项目讨论中尽可能地聊你擅长的内容,而避开不擅长的点,而且说的越多越好,因为面试时间虽然不是固定的,但也不会面得太长,如果你和面试官在实习 / 项目讨论上花掉了较多的时间,那么你可能可以避开一些你不好处理的知识型提问。

但不是说有实习项目经历就不需要准备知识型的问答内容,还是要准备好的,因为面试官也可能跳出你的实习和项目经历,来问一些单点或者实战类的问题。

(2)没有面试官觉得OK的实习 / 项目经历

在这种情况下,你需要在知识型问题上做好充足的备战,看面经积累常见的面试问题是一种手段,但最好是形成各个板块的框架,整理好常见的问题及回答方案。在数据分析岗,你至少需要准备好三个板块的内容,分别是“SQL”、“统计学”、“业务分析”,这三个板块是面试中出场概率最高且是考核的重点。除此之外,一些偏重技术的岗,还需要准备“机器学习”、“大数据”、“撕代码”等板块的内容。

当面试官开始提问的时候,如果问题是你擅长并准备过的,注意不要给自己挖坑。举个例子,面试官问:“请你说一下k-means聚类”。你对这个问题有准备,解释清楚了什么是k-means,但你多说了一句:“但k-means聚类不如DBSCAN聚类”,这个时候面试官就可能会抓住这一点进行下钻提问,问你:“那你说一下什么是DBSCAN聚类,并分析一下k-means为什么不如DBSCAN”。如果你对这个不了解的话,可能就会在面试中被问倒,影响评分(但这种情况也不是不能圆场,你可以说“在学校上多元统计这门课的时候,老师有提到这两个聚类方法的对比,k-means在一些情况下不如DBSCAN,具体总结了3-4点内容,但由于课程是两年前上的,具体不足之处我有一些忘记了,但在实际使用的时候,我可以通过资料查阅的方式找到关于它们之间的对比信息,并结合实际问题判断用哪种聚类比较好”)。

当面试官开始提问的时候,如果问题一上来就是你不擅长并且没有准备过的,注意老老实实承认不会,但说一下自己的大致想法以及自己擅长的领域,不要去硬答,宁愿不答也不要答错,因为面试官抛问题的时候也是有试探的,你不答可以再开一个问题(当然开太多新问题也会反映你的知识面相对于他的期待来说比较窄)。

总而言之,数据分析岗的面试,既要准备充足,也要不能怯场,单面有时候是会比较有压力。最后祝大家都能在秋招和未来的春招中拿到符合你预期的offer!

f0300b36f6341354433d324bea9800e7.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值