【hadoop期末复习】第十章 Spark 超详细讲解

** 本专栏的Hadoop复习计划文章内容主要包含以下几个部分:

【简单】学习通习题

【进阶】课本课后练习

【操作】相关章节实验回顾

最后一章了,大家加油!

学习通 - 习题

1. Spark SQL目前暂时不支持下列哪种语言

A.Java
B.Scala
C.Python
D.Lisp
我的答案:D

解析:

Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言


2. RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的操作的是

A.map
B.filter
C.count
D.groupBy
我的答案:C

解析:

Spark RDD支持两种类型的操作:

  • 动作(action):在数据集上进行运算,返回计算值
  • 转换(transformation): 基于现有的数据集创建一个新的数据集

3. 下列说法错误的是

A.RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算
B.Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN
C.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换
D.在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm
我的答案:C

解析:

C.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换

错误,RDD提供的转换接口都非常简单,都是类似map、filter、groupBy、join等粗粒度的数据转换操作,而不是针对某个数据项的细粒度修改(不适合网页爬虫)

4. 下列关于常见的动作(Action)和转换(Transf

  • 3
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值