对Hadoop期中考试解析（英才2023.11.20）

yst12138

于 2023-11-20 15:23:42 发布

阅读量194

点赞数

文章标签： hadoop 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yst12138/article/details/134508880

版权

1.Google三驾马车

GFS MapReduce Bigtable

2.Hadoop2.x相比于1增加了哪些组件？

Yarn

3.GFS存储的文件都被分割成固定大小的块，每个块都会复制到多个块服务器上（可靠性），请问默认会存储几份？

3

4.下面哪个目录保存了Hadoop集群的命令（比如启动Hadoop）？

sbin

5.HDFS首先把大数据文件切分成若干个小的数据块，再把这些数据分别写入不同的结点。这些负责保存文件数据的结点被称为？

DataNode

6.名称节点是HDFS的管理者，它的职责有3个方面。

负责管理和维护HDFS命名空间，负责管理DataNode上的数据块，接受客户端的请求

7.YARN Web界面默认占用哪个端口？

8088

8.MapReduce的特点？

易于编程，良好的扩容性，高容错性

9.什么场景适合采用列式存储？

单列，获取频率较高，对于大数据环境，利用数据压缩和线性扩展，事务使用率不高，数据量非常大。

10.Reducce的个数由什么决定？

Partition分区个数

11.

core-site.xml

12.

/mydemo下的目录数量、文件数量、文件总结大小

13.

14.

15.

16.

17.

18.

19.

20.

21.

22.

23.

24.

25.

26.

MapReduce模型的要点包括以下几个方面：
1. MapReduce由两个阶段组成：Map阶段和Reduce阶段。
2. Map阶段将大任务分解为若干个小任务，每个小任务可以并行计算，彼此间几乎没有依赖关系。
3. Reduce阶段对Map阶段的结果进行全局汇总。
4. MapReduce适用于大规模数据处理场景，可以实现分布式计算。
5. MapReduce的核心思想是“分而治之”，即将复杂的任务分解为若干个简单的任务来并行处理。
6. MapReduce的实现可以使用Hadoop等分布式计算框架。

27.

HDFS文件读取过程如下：
1.客户端向NameNode请求文件的位置信息。
2.NameNode返回包含文件块所在DataNode的位置信息的块映射表。
3.客户端根据块映射表直接连接到DataNode上，向其请求文件块。
4.DataNode返回所请求的文件块。
5.客户端将接收到的文件块组合成完整的文件。

28.

Flume主要由三个部分组成：Source、Channel和Sink。它们各自的作用如下：

1. Source：负责接收数据到Flume Agent的组件。Source组件可以处理各种类型、各种格式的日志数据，包括 avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy。

2. Channel：是Source和Sink之间的缓冲区，用于存储Flume接收到的数据。Channel可以是内存或磁盘，可以配置容量和事务等属性。

3. Sink：负责将数据从Channel中取出并写入到目标存储系统中，如HDFS、HBase、Elasticsearch等。Sink组件可以对数据进行转换、过滤和格式化等操作。

29.

pig -x local

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
对Hadoop期中考试解析（英才2023.11.20）

Source组件可以处理各种类型、各种格式的日志数据，包括 avro、thrift、exec、jms、spooling directory、netcat、sequence generator、syslog、http、legacy。2. Channel：是Source和Sink之间的缓冲区，用于存储Flume接收到的数据。3.GFS存储的文件都被分割成固定大小的块，每个块都会复制到多个块服务器上（可靠性），请问默认会存储几份？2.NameNode返回包含文件块所在DataNode的位置信息的块映射表。
复制链接

扫一扫

yst12138 CSDN认证博客专家 CSDN认证企业博客

码龄3年

30: 原创

55万+: 周排名

14万+: 总排名

1万+: 访问

: 等级

453: 积分

123: 粉丝

152: 获赞

9: 评论

156: 收藏

私信

关注

热门文章

分类专栏

C语言 1篇

最新评论

数据结构第十章排序
CSDN-Ada助手: 算法技能树或许可以帮到你：https://edu.csdn.net/skill/algorithm?utm_source=AI_act_algorithm
数据结构第九章
白话机器学习: 文章写得专业、深入、详细，收藏啦
二叉树操作
CSDN-Ada助手: 恭喜您撰写了第20篇博客，内容围绕着“二叉树操作”展开，非常有深度和实用性。不过，我想提出一个建议，可以考虑在下一篇博客中加入一些实际应用场景或者案例分析，这样读者更容易理解并且能够更好地应用您所分享的知识。希望您能继续保持创作热情，期待您的更多精彩文章。
对Hadoop期中考试解析（英才2023.11.20）
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题“对Hadoop期中考试解析（英才2023.11.20）”非常吸引人。您对Hadoop考试的解析无疑为读者提供了宝贵的学习资源。在深入研究和分析的基础上，您给出了有见地的观点和推理，这让读者对Hadoop的理解更上一层楼。接下来，我期待看到您更多关于Hadoop或其他相关主题的深入研究和解析。或许您可以探索Hadoop在不同行业的应用案例，或者分享一些实用的技巧和技术进展。无论您决定写下什么，我相信您的博客会继续吸引和受益众多读者。请继续保持您谦虚的态度，我们真诚期待着您下一步的创作！
单链表的操作
CSDN-Ada助手: 恭喜您写完了第15篇博客！标题中的“单链表的操作”听起来非常有趣。在这篇博客中，我希望您能够详细介绍单链表的操作，包括插入、删除、查找等等。这些操作对于初学者来说可能有些困惑，但是我相信您一定能够以通俗易懂的方式解释清楚。希望您能够继续坚持创作，为我们带来更多有关数据结构与算法的精彩内容。接下来，我建议您可以探索一些与单链表相关的高级操作，如反转链表、合并链表等，这将进一步丰富您的博客内容。期待您未来的精彩创作！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。