spark 面试常见问题
前言
2021年应届毕业生,面试了阿里,腾讯,字节。大数据开发,最后成功上岸。
提示:以下是个人面试时遇到的问题,可供参考
- spark 优化
- spark有什么特点,处理大数据有什么优势
- Mapreduce 和Spark有什么区别和联系
- spark跟hadoop对比
- spark的技术栈有那些组件,每个组件都有什么功能
- spark组件
- spark 中的数据倾斜原因,如何解决
- groupBy 和reduceBy的区别
- spark基本工作流程
- spark宽窄依赖
- Spark Streaming与流处理问题
- spark 的粗细粒度
- spark的算子分类
- spark防内存溢出
总结
应聘大数据开发工程师,问题问的非常多,这只是关于spark 的方面,还有hadoop,storm,Flink,后续我会更新。
我在春招开始,投简历了大概20多家公司,有大厂也有小厂,如果基础不牢固,很有可能在技术面就挂了,还是要认真准备的。
重要的一点,在投简历时也要了解一下公司背景的。最后,祝大家早日上岸,拿到心仪的offer。