hadoop合并日志_hadoop错题

最新推荐文章于 2021-04-21 19:15:05 发布

weixin_39831242

最新推荐文章于 2021-04-21 19:15:05 发布

阅读量195

点赞数

文章标签： hadoop合并日志

本文链接：https://blog.csdn.net/weixin_39831242/article/details/112152834

版权

1.磁盘是hadoop集群运行时的最主要瓶颈

2.snappy，Gzip压缩不能被切分

4.
HDFS-HA工作要点中元数据管理，描写正确的是？[多选]

【参考答案】: ABCD

【您的答案】: ABD

5.
配置机架感知的下面哪项正确：[多选]

【参考答案】: ABC

【您的答案】: AC

6.
ReduceTask工作机制描述不正确的是？

A、Copy阶段：ReduceTask从各个MapTask上远程拷贝一片数据，并针对某一片数据，如果其大小超过一定阈值，则写到磁盘上，否则直接放到内存中。
B、Combine阶段：当所有数据处理完成后，ReduceTask对所有临时文件进行一次合并，以确保最终只会生成一个数据文件。
C、Sort阶段：按照MapReduce语义，用户编写reduce()函数输入数据是按key进行聚集的一组数据。为了将key相同的数据聚在一起，Hadoop采用了基于排序的策略。由于各个MapTask已经实现对自己的处理结果进行了局部排序，因此，ReduceTask只需对所有数据进行一次归并排序即可。
D、Reduce阶段：reduce()函数将计算结果写到HDFS上。

【参考答案】: B

【您的答案】: A

7.
对OutputFormat接口实现类描述正确的是？[多选]

A、OutputFormat是MapReduce输出的基类
B、所有实现MapReduce输出都实现了OutputFormat接口
C、TextOutputFormat是默认的输出格式，它把每条记录写为文本行。它的键和值可以是任意类型，因为TextOutputFormat调用toString（）方法把它们转换为字符串。
D、SequenceFileOutputF输出作为后续MapRedue任务的输入，这便是一种好的输出格式，因为它的格式紧凑，很容易被压缩。

【参考答案】: ABCD

【您的答案】: BD

8.
HDFS小文件解决方案描述正确的是？[多选]

【参考答案】: ABCD

【您的答案】: ABC

关注