秋招第七弹:网易一面-数据开发工程师
写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。
时长:40min
因为网易面的时间太久了,而且当时也没有做复盘,所以很多问题都想不起来了,总结的不是特别全
-
自我介绍
-
实习负责的内容
-
项目中用户域是怎么做的?
这个问题问得好啊,可见网易对项目还是很好奇的,第一次碰到会直接问那么细的问题。直接问到用户域。当然因为可能涉及到公司的机密,没有太明说,只是说了现在都会通用的一些建设模型和业务过程。也和面试官说明了涉及到用户策略的敏感信息不太能说。
-
数据倾斜怎么处理的?为什么加盐?怎么加盐?
不同于平常的数据倾斜提问,在我说出来一种加盐处理方式后,问我怎么加盐,我怀疑应该是太多人说这些了,面试官怀疑是背的八股,想看一下是不是真的处理过数据倾斜
-
怎么避免数据热点问题?
我回答加盐,面试官问还有其他方法吗?我想了想,可能是要我从不同的数据处理阶段去回答这些问题
-
MR脚本写过吗?MR脚本怎么写的?每个阶段怎么执行的?
-
MR的shuffle为什么比spark的shuffle慢
我回答了spark的shuffle会有buffer缓冲,但后来考虑一下,spark对于shuffle的优化也可以说
-
hadoop如何确定map的数量的?reduce数量怎么确定的?
-
sql题目:连续登录问题
-
sql题目:班级考试成绩,实现行转列,能不能使用两种方法实现?比较两种方法的不同
-
算法题:机器人扫地,常见的动态规划问题,lc中应该属于个简单的题目
总结:网易一面其实还算友好,没有太刁难的问题,面试官也比较和善吧,因为时间太久确实想不起来这个面试的太多问题,可能不是很全,只回忆了几个比较记忆深刻的问题,见谅见谅