Spark常见面试题

最新推荐文章于 2024-10-10 13:23:57 发布

勇哥聊IT

最新推荐文章于 2024-10-10 13:23:57 发布

阅读量1.7k

点赞数

分类专栏：笔试面试算法刷题互联网笔试面试题整理文章标签：大数据 spark 笔试面试

笔试面试同时被 3 个专栏收录

20 篇文章 2 订阅

订阅专栏

互联网笔试面试题整理

19 篇文章 5 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

1、scala 语言有什么特点，相比java有什么优点?

2、什么是Scala的伴生类和伴生对象?

3、spark有什么特点，处理大数据有什么优势?

4、Spark技术栈有哪些组件，每个组件都有什么功能，适合什么应用场景?

5、Apache Spark有哪些常见的稳定版本，Spark1.6.0的数字分别代表什么意思?

6、Mapreduce和Spark有什么区别与联系?

7、简单说一下hadoop和spark的shuffle相同和差异?

8、Spark为什么比mapreduce快?

9、简要描述Spark分布式集群搭建的步骤?

10、spark的有几种部署模式，每种模式特点?

11、spark集群运算的模式有哪些?

12、Spark有哪些算子，列举几个你熟悉的?

13、spark中的RDD是什么，有哪些特性?

14、谈谈spark中的宽窄依赖?

15、cache和pesist有什么区别?

16、spark rdd 如何区分宽依赖和窄依赖?

17、RDD中reduceBykey与groupByKey哪个性能好，为什么?

18、spark streming在实时处理时会发生什么故障，如何停止，解决?

19、spark streaming 读取kafka数据的两种方式?

20、spark 如何防止内存溢出?

21、如何解决spark中的数据倾斜问题?

22、spark中的数据倾斜的现象、原因、后果?

23、Spark有哪些优化方法?

24、spark中如何划分stage?

25、spark有哪些组件? ?

26、Spark中Work的主要工作是什么?

27、Spark driver的功能是什么?

28、如何配置spark master的HA?

29、Spark master HA 主从切换过程不会影响集群已有的作业运行，为什么?

30、Spark master使用zookeeper进行HA的，有哪些元数据保存在Zookeeper?

31、Spark master HA 主从切换过程不会影响集群已有的作业运行，为什么?

32、Spark master使用zookeeper进行HA的，有哪些元数据保存在Zookeeper?

33、spark-submit的时候如何引入外部jar包?

34、spark面试需要储备哪些知识?

35、Spark on Mesos中，什么是的粗粒度分配，什么是细粒度分配，各自的优点和缺点是什么?

关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。