Spark 1.X 大数据平台V2(第四周作业)

最新推荐文章于 2015-09-25 09:53:18 发布

撸依天

最新推荐文章于 2015-09-25 09:53:18 发布

阅读量460

点赞数

分类专栏： spark

本文链接：https://blog.csdn.net/korder/article/details/47127221

版权

spark 专栏收录该内容

14 篇文章 0 订阅

订阅专栏

1 . 假如数据源来自网络，数据默认会在几个node的内存中缓存住。

•   A. 1
•   B. 2
•   C. 3

选B
    当数据源来自于网络时（例如通过Kafka、Flume、sockets等等），默认的持久化策略是将数据保存在两台机器上，这也是为了容错性而设计的。

2 . Spark Streaming默认持久化的级别是什么？

•   A. 内存+序列化
•   B. 内存+非序列化
•   C. 磁盘+序列化
•   D. 磁盘+非序列化
选A
    Spark Streaming默认将接收到的数据序列化后存储以减少内存的使用。但序列化和反序列化需要更多的CPU时间，因此更加高效的序列化方式（Kryo）和自定义的序列化接口可以更高效地使用CPU。

3 . 假设batchDuration已经设置为2秒，那么在做window操作的时候，下列哪些slide interval的设置是合法的？

4 . Spark Streaming最后还是通过Spark来执行任务的?

正确

5 . Spark Streaming 和 Storm的运行模型是一样的?

错误

6 . Spark Streaming一定不会有数据丢失?

错误

7 . RDD cache默认的StorageLevel级别是什么?

撸依天

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Spark 1.X 大数据平台V2(第四周作业)

1 . 假如数据源来自网络，数据默认会在几个node的内存中缓存住。• A. 1• B. 2• C. 3选B 当数据源来自于网络时（例如通过Kafka、Flume、sockets等等），默认的持久化策略是将数据保存在两台机器上，这也是为了容错性而设计的。2 . Spark Streaming默认持久化的级别是什么？• A. 内存+序列化• B. 内存+非序列化
复制链接

扫一扫