秋招第一弹:百度一面-大数据开发工程师
写在最前:秋招以来一直在冲,因为事情比较多,对于笔试面试一直没有复盘,现在靠仅存的记忆把面试的一些问题记录下来,尽可能记录出能回忆到的问题,但可能记的不是很全。
时长:60min左右
形式:线上面试-如流会议(百度内部会议平台)
-
先自我介绍,大概两分钟左右
-
面试官根据我的信息先问了我的实习内容,然后介绍了他们的工作内容,问我是否符合预期
说实话这个操作给我问蒙了,没见过上来就介绍他们的工作内容的,后面想想应该是我在介绍中说了自己不能接受的一些工作内容,面试官介绍了一下自己的
-
问了简历中项目的一些细节和实现方式
-
项目中的亮点和难点
这个问题差不多每个面试都会被问,对于有一些项目经历的面试官可能会偏重项目,对没有项目经历的可能会偏重八股文
-
数据倾斜碰到过没有?怎么造成的?怎么解决的
也是一个非常常问到的八股文问题,结合实际生产中的解决方法会好一些
-
写过hive的udf、udaf、udtf吗?
-
写过什么自定义函数?怎么实现的?
-
怎么快速的分析出数据出现了倾斜?快速定位到哪里出现了倾斜?yarn上怎么看?
-
数据的存储格式和压缩格式?真实生产场景中怎么用的?选择的哪种格式?为什么选择这种格式?
-
平时生产环境中任务出现告警怎么处理?高优任务怎么保证?
-
java中如何快速读取大文件?线程底层怎么实现的?
这鬼知道怎么实现的
-
一个完整的http请求应该什么样?如果是https请求呢?
-
页面置换算法有哪些了解?
-
现场撕了两道题,第一道是个sql
此sql是灰常变态了,实现一个漏斗分析,开始还平平无奇,用sql实现了之后,面试官开始了升级,让写scala实现,我说写的可能不是很完整,可以把大概思路写出来,面试官说可以,我写了大概之后,面试官再次升级,写udf可以实现吗?我当时脑瓜子一阵嗡嗡,想了想说可以用udaf实现,面试官说实现一下,我大概说了下思路,面试官点点头说可以(我当时都不知道自己说的啥思路)
-
第二道是个比较简单的算法题,合并两个有序数据
-
反问
问了工作具体内容和负责的业务
问了这次面试结果什么时候出来,面试官说给你约个下午的二面,但是好像他们的面试系统出了问题,他们约的容易重复,就让hr约了一个二面事件
总结:百度的面试总体来说其实还是比较吃力的,好在有一些项目经历让面试官问,我也是在项目经历上尽量多说让他们少问,占用点时间,不然真是扛不住。面试表现其实不是很好,好在面试官还是比较和善,给通过了,甚至当时觉得是刷kpi,通过之后甚至觉得是面试官想让他的同时也刷下kpi hhh