Spark 1.X 大数据平台V2(第四周作业)

1 . 假如数据源来自网络,数据默认会在几个node的内存中缓存住。

•   A. 1
•   B. 2C. 3

选B
    当数据源来自于网络时(例如通过Kafka、Flume、sockets等等),默认的持久化策略是将数据保存在两台机器上,这也是为了容错性而设计的。

2 . Spark Streaming默认持久化的级别是什么?

•   A. 内存+序列化
•   B. 内存+非序列化
•   C. 磁盘+序列化
•   D. 磁盘+非序列化
选A
    Spark Streaming默认将接收到的数据序列化后存储以减少内存的使用。但序列化和反序列化需要更多的CPU时间,因此更加高效的序列化方式(Kryo)和自定义的序列化接口可以更高效地使用CPU。 

3 . 假设batchDuration已经设置为2秒,那么在做window操作的时候,下列哪些slide interval的设置是合法的?

4 . Spark Streaming最后还是通过Spark来执行任务的?

正确

5 . Spark Streaming 和 Storm的运行模型是一样的?

错误

6 . Spark Streaming一定不会有数据丢失?

错误

7 . RDD cache默认的StorageLevel级别是什么?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

撸依天

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值