《Spark大数据分析与内存计算》——第三章

第三章作业及答案

快捷查找:Ctrl+F   在搜索框中输入题目

一. 单选题(共17题)

1. (单选题)并不是所有企业都能自己产生数据,从而用于决策辅助,而更多的互联网企业如电商等大部分是要靠什么来抓取互联网数据进行分析

A. Hadoop

B. python

C. Spark

D. 网路爬虫

正确答案: D:网路爬虫 ;

2. (单选题)什么负责即席查询的应用

A. MLlib

B. Spark Streaming

C. GraphX

D. Spark SQL

正确答案: D:Spark SQL ;

3. (单选题)Spark主要使用什么语言进行开发

A. JAVA

B. C#

C. Scala

D. Python

正确答案: C:Scala ;

4. (单选题)什么类提供了对广播变量的操作方法

A. pyspark.RDD

B. pyspark.Broadcast

C. pyspark.SparkContext

D. pyspark.SparkConf

正确答案: B:pyspark.Broadcast ;

5. (单选题)什么负责机器学习的应用

A. GraphX

B. MLlib

C. Spark Streaming

D. Spark SQL

正确答案: B:MLlib ;

6. (单选题)什么模式用于Spark客户端直接连接Yarn。

A. standalone

B. local

C. yarn

D. mesos

正确答案: C:yarn ;

7. (单选题)什么模式用于构建一个由Master+Slave构成的Spark集群

A. standalone

B. local

C. mesos

D. yarn

正确答案: A:standalone ;

8. (单选题)Spark控制日志输出内容的方式有几种

A. 1

B. 3

C. 4

D. 2

正确答案: D:2;

9. (单选题)修改其中的什么文件,能够帮助我们在后期的使用中快速启动Jupyter

A. properties

B. source

C. profile

D. password

正确答案: C:profile ;

10. (单选题)什么模式用于Spark客户端直接连接Mesos

A. yarn

B. mesos

C. standalone

D. local

正确答案: B:mesos ;

11. (单选题)PySpark拥有几种启动模式

A. 6

B. 3

C. 4

D. 5

正确答案: C:4;

12. (单选题)什么负责图像处理的应用

A. GraphX

B. MLlib

C. Spark SQL

D. Spark Streaming

正确答案: A:GraphX ;

13. (单选题)什么类提供了应用与 Spark 交互的主入口点,表示应用与 Spark 集群的连接

A.  pyspark.SparkContext

B.  pyspark.RDD

C.  pyspark.SparkConf

D. pyspark.Broadcast

正确答案: A: pyspark.SparkContext ;

14. (单选题)什么负责实时流处理的应用

A. MLlib

B.  Spark Streaming

C. GraphX

D. Spark SQL

正确答案: B: Spark Streaming ;

15. (单选题)什么为有向无环图,在 Spark 中使用其来描述我们的计算逻辑

A. DAG

B. GraphX

C. MLlib

D. Spark SQL

正确答案: A:DAG ;

16. (单选题)什么类提供了对一个 Spark 应用程序配置的操作方法

A. pyspark.SparkContext

B. pyspark.SparkConf

C. pyspark.RDD

D. pyspark.Broadcast

正确答案: B:pyspark.SparkConf ;

17. (单选题)什么类提供了对累加器变量的操作方法

A. pyspark.SparkConf

B. pyspark. Accumulator

C. pyspark.SparkContext

D. pyspark.Broadcast

正确答案: B:pyspark. Accumulator ;

二. 多选题(共7题)

18. (多选题)Python的基础库包括

A. Pandas

B. Scipy

C. Numpy

D. Matplotlab

正确答案: ABCD:Pandas; Scipy ; Numpy; Matplotlab ;

19. (多选题)PySpark 提供的类信息如下

A. pyspark.SparkContext

B. pyspark.SparkConf

C. pyspark.Broadcast

D. pyspark.RDD

正确答案: ABCD:pyspark.SparkContext ; pyspark.SparkConf ; pyspark.Broadcast ; pyspark.RDD ;

20. (多选题)PySpark 启动模式分为

A. standalone

B. yarn

C. local

D. mesos

正确答案: ABCD:standalone ; yarn ; local ; mesos ;

21. (多选题)Python所具有的优点包括

A. 简单易学

B.  强大的可移植性

C. 具有丰富的库

D. 免费开源

正确答案: ABCD:简单易学 ; 强大的可移植性 ; 具有丰富的库 ; 免费开源 ;

22. (多选题)相对于其他语言,Python相比于其他语言所具有的优点有哪些

A. 自然语言和文本处理库

B. 更加人性化设计

C. 机器学习库

D. 总体的AI库

正确答案: ABCD:自然语言和文本处理库 ; 更加人性化设计 ; 机器学习库; 总体的AI库 ;

23. (多选题)Python开发语言特点有哪些

A. 简单易学

B. 可移植性强

C. 免费开源

D. 丰富的库

正确答案: ABCD:简单易学 ; 可移植性强 ; 免费开源 ; 丰富的库 ;

24. (多选题)PySpark安装方式有哪些

A. 在线安装

B. 离线安装

C. 多重安装

D. 简易安装

正确答案: AB:在线安装 ; 离线安装 ;

三. 判断题(共11题)

25. (判断题)Spark也具备多种模式的运行。Spark是分为local、standalone、yarn、mesos等运行模式的。

A. 对

B. 错

正确答案: 对

26. (判断题)Jupyter Notebook可以用来数据清理和转换,数值模拟,统计建模,机器学习等等。

A. 对

B. 错

正确答案: 对

27. (判断题)Anaconda能够帮助你管理环境。

A. 对

B. 错

正确答案: 对

28. (判断题)Python是Anaconda的开源发行版本。

A. 对

B. 错

正确答案: 错

29. (判断题) PySpark的在线安装相比于离线安装较为简单。

A. 对

B. 错

正确答案: 错

30. (判断题)Spark有效的日志级别包括:ALL, DEBUG, ERROR, FATAL, INFO, OFF, TRACE。

A. 对

B. 错

 正确答案: 对

31. (判断题)PySpark 是 Spark 为 Python 开发者提供的 API。

A. 对

B. 错

正确答案: 对

32. (判断题)人工智能要求机器能自主学习成长,机器要会学习,就要积累大量的数据,然后运用机器学习算法如线性回归、决策树、神经网络等。

A. 对

B. 错

正确答案: 对

33. (判断题)PySpark 是 Spark 为 Python 开发者提供的 API,用简单的话来说就是用Python来连接Spark,一般情况下是将Python API链接到Spark Core并初始化SparkContext。

A. 对

B. 错

正确答案: 对

34. (判断题)Pycharm分为Professional和Community两种版本。

A. 对

B. 错

正确答案: 对

35. (判断题)Spark控制日志输出内容的方式有修改log4j.properties(或者)代码中使用setLogLevel(logLevel)控制日志输出。

A. 对

B. 错

正确答案: 对

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值