** 本专栏的Hadoop复习计划文章内容主要包含以下几个部分:
【简单】学习通习题
【进阶】课本课后练习
【操作】相关章节实验回顾
最后一章了,大家加油!
学习通 - 习题
1. Spark SQL目前暂时不支持下列哪种语言
A.Java
B.Scala
C.Python
D.Lisp
我的答案:D
解析:
Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言
2. RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的操作的是
A.map
B.filter
C.count
D.groupBy
我的答案:C
解析:
Spark RDD支持两种类型的操作:
- 动作(action):在数据集上进行运算,返回计算值
- 转换(transformation): 基于现有的数据集创建一个新的数据集
3. 下列说法错误的是
A.RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算
B.Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN
C.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换
D.在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm
我的答案:C
解析:
C.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换
错误,RDD提供的转换接口都非常简单,都是类似map、filter、groupBy、join等粗粒度的数据转换操作