大家好,我是老兵。
金三银四招聘季即将到来,相信不少同学都开始摩拳擦掌准备了。
目前我也在帮很多小伙伴内推
,收到了很多真实的面试反馈。
其中发现由于哔哩哔哩(B站)最近爆出的新闻:"扩招某岗位1000人"
,竟连带着面试B站大数据方向的程序员也多了起来。
今天就有一个小伙伴刚通过B站三面,趁热乎,赶紧为大家奉上最新出炉
的社招真题。
说实话看到薪资我酸了
~
1 面试过程
面试岗位: 大数据平台工程师
岗位要求: 偏平台研发、推荐方向
面试形式:一轮笔试 + 三轮面试
(原先视频面试经双方沟通后取消)
面试难度:中等
2 一面 (现场笔试)
好久没有笔试了,有点不适应~
1)简单画出Flink on Yarn
模式的执行流程并说明
2)写出你了解的机器学习
算法,并选择其中一种简述其原理
3)写出社交APP中一般推荐算法
实现过程,试分析其业务逻辑和技术实现
4)广度优先
和深度优先
算法的实现伪代码
5)编程题
: MR计算pv/uv
6) 编程题
: Spark SQL统计pv/uv
大约写了半个小时,有点忐忑~
3 一面 (现场面试)
面试官: Flink负责人
面试时长: 50min
面试官扫了一眼结果,2-3分钟后进行面试
1)xx 项目架构介绍一下,集群规模
和数据量
多大,你参与了哪部分设计?为什么要选用这些组件?
2) Flink 的watermark
机制是什么?
3) 你们的 Flink 部署方式
是什么?有什么特点?
4) Flink背压
遇到过吗?具体说说是怎么解决的。
5)Hive SQL
底层怎么转换成MapReduce?
6) Hbase的工作机制
了解吗?怎么保障一条数据顺序插入
时同时进行读取操作的?
7) Sqoop
可以保证数据不丢失吗?如果丢失怎么办?
8)有了解过一些企业级
的大数据平台吗?是否有动手搭建过?
9) Redis
的Hash原理
知道吗?集群模式如果一个节点挂了,Redis怎么处理?
10) 生产中遇到过数据倾斜
吗?你是如何解决的?
11)分布式流计算如何保证数据Exactly-once一致性
?Flink 和 Spark 分别怎么实现?
有点口感舌燥,和面试官友好的握握手,接着送我出电梯,回去等邮件通知。。
4 二面 + 三面 (现场面试)
面试官: 技术负责人 + 总监
面试时长: 50min+
隔几天告知面试通过,进行二面
1) xx 项目的技术架构
说一下?为什么要这样设计?
2)项目上经常遇到哪些问题
,如何解决的?
3) 在你做过的项目中,Kafka队列当日最大并发
多少?如何支撑
并发的?
4)如果存在Kafka并发
支撑不了,怎么进行优化
改良?说说思路。
5)kafka 是如何保证数据的安全性
和可靠性
的
6)kafka 的数据是有序的
吗?Kafka 是如何保证单个消费者顺序消费
的?多个消费者顺序消费怎么实现?
7)Kafka
为什么这么快?
8)能够用伪代码实现kafka的zero-copy
吗
9)Hive元数据
存储了哪些信息?
10)Hive的UDF
、UDAF
用过吗?
11)生产中数据去重
怎么做?
被问的很懵,勉强答上来。又来了个面试官,直接三面~
12) xx 项目的数据仓库分层架构
是什么?为什么要进行维度建模
?和主题建模
有什么区别?
13) Flink 一致性快照的实现原理
14)Flink
做过哪些性能
优化?
15)xx 推荐系统
的技术架构是什么?遇到什么问题 ?做了哪些调参
?
16)召回
有哪些阶段? 你们怎么做精准召回
的?
17) 数据质量如何如何监控的?
18) 有什么想问我的?
最后,面试官和我说比较满意,送我下了电梯。
最后小伙伴已经收到了三面通过
的邮件,想来也是谈好了福利待遇。
5 福利赠送
看完大佬的面试经过,心中不由得升起了敬佩
之意。其中涉及的知识点和技能之多,也令我咋舌不已。
金三银四
马上就要来了,估计有很多小伙伴们也想和这位大佬一样能够成功上岸,进大厂
搬砖。
在这里,老兵为大家准备了一份超级详细的进大厂面试攻略
和简历模板
。
》》请关注公众号: 大数据兵工厂