大数据存储与计算
文章平均质量分 83
ᯤ⁹ᴳ⁺ ·
在读本科生
展开
-
阶段性测试二
3.Spark Streaming 接收【 正确答案: 实时输入】的数据流,并将数据流以【 正确答案: 时间片(秒级)】为单位拆分成批次,然后将每个批次交给 Spark 引擎(或 Spark Core)进行处理,最终生成以批次组成的结果数据流。5.Spark SQL支持读取【 正确答案: text】、【 正确答案: json】、【 正确答案: parquet】类型的文件。【 正确答案: A B C D】【 正确答案: C】4.下面关于Spark MLlib库的描述正确的是 【 正确答案: A C】原创 2024-01-16 03:23:54 · 458 阅读 · 0 评论 -
阶段性测试一
8.在使用MapReduce程序WordCount进行词频统计时,对于文本行"hello hadoop hello world",经过WordCount程序的Map函数处理后直接输出的中间结果,应该是 ©。3.YARN是负责集群资源调度管理的组件。C.<“hello”,1>、<"hello"1>、<“hadoop”,1>和<“world”,1>D.<“hello”<1,1>>、<“hadoop”,1>和<“world”,1>A.<"hello"1,1>、<“hadoop”,1>和<“world”,1>原创 2024-01-16 03:02:45 · 833 阅读 · 0 评论