《Spark大数据分析与内存计算》——第一章

阿万古

已于 2023-12-13 15:20:11 修改

阅读量490

点赞数

分类专栏：课程作业文章标签： spark python

于 2023-12-13 15:20:02 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_54127955/article/details/134973185

版权

课程作业专栏收录该内容

25 篇文章 5 订阅

订阅专栏

第一章习题集答案

快捷查找：Ctrl+F 在搜索框中输入题目

一. 单选题（共3题）

1. (单选题)下面哪个不是Spark 的四大组件

A. Spark Streaming

B. park R

C. Graphx

D. Mlib

正确答案: B:park R ;

2. (单选题)Spark 哪个模式利用的Hadoop 的资源管理器

A. Spark on local

B. spark on YARN

C. spark on mesos

D. standalone

正确答案: B:spark on YARN ;

3. (单选题)Stage 的 Task 的数量由什么决定

A. TaskScheduler

B. Job

C. Partition

D. Stage

正确答案: C:Partition ;

二. 多选题（共6题）

4. (多选题)Spark的四大特点有什么

A. 支持多种资源管理器

B. 简单

C. 易用

D. 迅速

E. 通用

正确答案: ACDE:支持多种资源管理器 ; 易用 ; 迅速; 通用;

5. (多选题)Spark与Hadoop的区别为

A. 解决问题方式不同

B. 特点不同

C. 应用场景不同

D. 两者可合可分

正确答案: AD:解决问题方式不同 ; 两者可合可分 ;

6. (多选题)Spark Core包括什么

A. Spark SQL

B. Hash

C. SparkContext

D. Mllib

正确答案: AD:Spark SQL ; Mllib ;

7. (多选题)Spark特点包括

A. 稳健

B. 大量

C. 迅速

D. 易用

正确答案: CD:迅速 ; 易用 ;

8. (多选题)Spark的架构包括

A. Cluster Manager

B. Executor

C. Worker

D. Driver App

正确答案: ABCD:Cluster Manager ; Executor ; Worker ; Driver App ;

9. (多选题)Spark2.X新特征简单讲述三方面，分别为

A. 智能优化

B. 精简的API

C. Spark Core 的优化

D. Spark作为编译器

正确答案: ABD:智能优化 ; 精简的API ; Spark作为编译器 ;

三. 判断题（共14题）

10. (判断题) Spark可以非常方便地与其他的开源产品进行融合。

A. 对

B. 错

正确答案: 对

11. (判断题)Spark SQL是Spark用来操作非结构化数据的组件

A. 对

B. 错

正确答案: 错

12. (判断题)Spark支持多种资源管理器。

A. 对

B. 错

正确答案: 对

13. (判断题)Spark在2010年由Matei Zaharia在加州大学伯克利分校的AMPLab

A. 对

B. 错

正确答案: 错

14. (判断题)Spark则是一个专门的，用来对那些分布式存储的大数据进行处理的工具，它会进行分布式数据的存储。

A. 对

B. 错

正确答案: 错

15. (判断题)MLlib是Spark提供的一个机器学习算法库。

A. 对

B. 错

正确答案: 对

16. (判断题)Spark要比Hadoop快 10x-100x。

A. 对

B. 错

正确答案: 错

17. (判断题)Spark是基于内存的技术。

A. 对

B. 错

正确答案: 错

18. (判断题) Spark能够帮助我们处理那些需要处理大量实时或压缩数据的计算密集型的任务和挑战。

A. 对

B. 错

正确答案: 对

19. (判断题)Spark 2.0搭载了第二代Tungsten引擎。

A. 对

B. 错

正确答案: 对

20. (判断题)Spark的存在将代替Hadoop。

A. 对

B. 错

正确答案: 错

21. (判断题)Spark的构架设计，它分为4个组成部分，分别为Cluster Manager、Worker、Executor、Driver API。

A. 对

B. 错

正确答案: 错

22. (判断题)MapReduce上的不同作业在同一个节点运行时，会各自启动一个JVM（Java虚拟机）。而Spark同一节点的所有任务都可以在一个JVM上运行。

A. 对

B. 错

正确答案: 对

23. (判断题)Spark Core提供Spark最基础与最核心的功能，它的子框架包括Spark SQL，Spark Streaming，MLlib和GraphX。

A. 对

B. 错

正确答案: 对

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
《Spark大数据分析与内存计算》——第一章

(单选题)下面哪个不是Spark 的四大组件A.Spark StreamingB.park RC.GraphxD.Mlib
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。