前言
作为一个“好兵”,我从不打无准备的仗,毕竟知己知彼才能游刃有余。无论现在的你处于什么水平,技术拥有怎样的深度,都不得不承认,任何时候都需要你能够主动地去学习,面试也要提前做准备。如果你的职业发展有更长远的打算和规划,那就更应该沉稳下来,脚踏实地,一步一步。
好未来(大数据)
一面(50分钟)
聊项目
hive:内部表,外部表 ,数据倾斜及解决,锁表
spark:reducebykey和groupbykey的区别
flink:如何保证一致性
说了一下check和barrier
sql的索引及区别
说了一下聚集和非聚集
innodb和myism简单说了一下
做题:左上到右下的消耗最小
sql:求七日连续登录的人
反问:业务内容和评价
二面
操作系统如何工作(懵比)
然后问如何进行内存管理和文件管理,进程管理
讲一下hadoop这些分布式如何实现
讲了一下主从复制和选举(谷歌三大论文里面的一些知识)
讲一下RDD如何实现分布式的
做题:数组的第二大数
Kafka如何实现分布式
讲了一下broke和partiton 感觉面试官不太满意
让手写网络编程 实现服务 对redis的各种数据结构调度
反问哪些方向需要提高
10分钟之后凉凉
携程(数据开发)
一面(30分钟)
聊项目
问算法,逻辑回归、和svm的计算流程
xgb的特征重要性计算原理
项目其他的算法问题
数据库索引:聚集索引和非聚集索引
做题:两个数组求交集
顺丰(大数据)
一面(40分钟)
java 多态概念,抽象接口和抽象类
java hashmap及底层原理
java sleep和wait 哪个会释放资源
做题:二叉树左视图
一个无序堆,变成大根堆时间复杂度
Spark RDD和dataframe,数据倾斜及解决办法。
Spark 内存模型
减少并行的task数量能否减少内存压力
面试资料总结
下面先给大家上一个总的目录大纲,基础的东西就不进行过多的赘述,我们将会从面试必问的说起,同时由于每篇的内容过多,我们也只说重点,太过基础的内容谁都会,我就不多敲字浪费大家的时间了!
有需要的朋友点击这里自取就好了,希望资料对你帮助!
SpringCloud

Redis

JVM

MySQL

Zookeeper

Kafka

最后
由于文章篇幅有限,PDF的内容又很多,全部手敲下来很累…所以需要阅读阅读学习的,大家“一件三连后:“查看下方””即可拿到手之后自己学习吧,博主真的打字打累了。
有需要的朋友点击这里自取就好了,希望资料对你帮助!
预祝大家前程似锦,工作顺利!

本文分享了大数据面试实战经验,涵盖Hadoop、Spark、Java、SQL、Redis、JVM等核心知识点,包括项目实践、算法理解、内存管理与分布式系统详解,助你提升面试成功率。
3152





