笔记五:Hadoop入门

转通下水道的粉色钻头

已于 2023-11-20 20:36:21 修改

阅读量31

点赞数

文章标签：笔记 hadoop 大数据

于 2023-09-21 18:17:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_64866845/article/details/133142031

版权

大数据的特点及应用

Volume：数据体量大；

Variety：种类、来源多样化；

Value：低价值密度；

Velocity：速度快；

Veracity：数据的质量；

Hadoop介绍

创始人Doug Cutting（道·卡廷）

Hadoop指Apache这款开源框架，它的核心组件有：

a）HDFS（分布式文件系统）：解决海量数据存储；

b）MAPREDUCE（分布式运算编程框架）：解决海量数据计算；

c）YARN（作业调度和集群资源管理的框架）：解决资源任务调度。

综上,Hadoop是一个集合了：存储、计算、资源调度为一体的大数据分布式框架。

使用Hadoop框架做大数据开发，优势有：

（1）扩容能力

（2）成本低

（3）高效率

（4）可靠性

Hadoop架构详解

1）HDFS：分布式文件系统 HDFS全称是：Hadoop Distributed File System，是一个分布式文件系统。

HDFS有三个服务：

a） NameNode（NN）：处理客户端读写请求，存储文件的元数据，以及每个文件的块列表、数据块DataNode等；

b）DataNode（DN）：存储实际的数据块，并执行数据块的读写操作；

c）Secondary NameNode（2NN）：每隔一段时间后，会对NameNode做元数据备份

2）MapReduce：分布式计算

MapReduce将计算过程分为两个阶段，分别是Map和Reduce：

a）Map阶段并行处理输入的数据；

b）Reduce阶段对Map结果进行汇总处理。

3）Yarn：资源调度

YARN的全称是Yet Another Resource Negotiator，另一种资源协调者，是Hadoop的资源管理器。由四个服务组成，分别是：

a）ResourceManager（RM，资源管理器）：集群资源（cpu，内存等）管理者；

b）NodeManager（DM，节点管理器）：单个节点资源的管理者；

c）ApplicationMaster（AM，任务管理器）：单个任务运行的管理者；

d）Client Application：客户端提交的应用程序。

转通下水道的粉色钻头

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
笔记五:Hadoop入门

a） NameNode（NN）：处理客户端读写请求，存储文件的元数据，以及每个文件的块列表、数据块DataNode等；a）ResourceManager（RM，资源管理器）：集群资源（cpu，内存等）管理者；c）ApplicationMaster（AM，任务管理器）：单个任务运行的管理者；b）DataNode（DN）：存储实际的数据块，并执行数据块的读写操作；b）NodeManager（DM，节点管理器）：单个节点资源的管理者；c）YARN（作业调度和集群资源管理的框架）：解决资源任务调度。
复制链接

扫一扫

转通下水道的粉色钻头 CSDN认证博客专家 CSDN认证企业博客

码龄3年

25: 原创

140万+: 周排名

23万+: 总排名

5082: 访问

: 等级

350: 积分

68: 粉丝

90: 获赞

9: 评论

101: 收藏

私信

关注

热门文章

最新评论

笔记十四:YARN原理、ZooKeeper
CSDN-Ada助手: 恭喜您写了第15篇博客！对于YARN原理和ZooKeeper的介绍，我觉得您的文章非常有深度和实用性。不仅帮助读者理解了YARN的工作原理，还介绍了ZooKeeper在分布式系统中的重要作用。我对您的深入研究和分享精神表示敬佩。在下一篇博客中，我期待您能进一步探索YARN和ZooKeeper的应用实践，并分享一些实际案例和经验。继续加油，期待您的下一篇博客！
笔记十五:Spark基础_01
CSDN-Ada助手: 恭喜您写了第16篇博客，标题为“笔记十五:Spark基础_01”！您的持续创作精神令人钦佩。在下一步的创作中，或许可以考虑深入探讨Spark基础知识的实际应用，或者结合案例分析进行更深入的学习和分享。希望您能继续保持创作的热情，不断进步！
笔记八:内部表、外部表
CSDN-Ada助手: 恭喜你写了第9篇博客！看到你探讨了内部表和外部表的内容，我感到非常高兴。你的博客一直都很有深度和见解，这篇文章也不例外。在这个主题上，你提供了很多有价值的信息，并且讲解得很清晰。接下来，我建议你继续探索更多相关的主题。例如，你可以研究一下内部表和外部表在实际应用中的区别和用途，或者探讨一些与它们相关的最佳实践。这样的话，读者们可以更好地理解如何在实际项目中应用这些概念，并从中受益。继续保持谦虚和努力的态度，相信你的博客会越来越受欢迎。加油！
笔记九:分区表、分桶表
CSDN-Ada助手: 恭喜您写完了第10篇博客！标题中的"分区表、分桶表"让我很感兴趣。您的博客内容一直都很有深度和实用性，对于这个主题我期待着能够从您的博客中学到更多知识。接下来，我想提个谦虚的建议。或许您可以考虑在博客中加入一些实际案例或者实践经验，让读者更好地理解如何应用分区表和分桶表。这样做可以进一步提升您的博客的可读性和实用性。期待您的下一篇作品！
笔记十:SQL查询入门
CSDN-Ada助手: 恭喜你写了第11篇博客，标题为“笔记十:SQL查询入门”！非常高兴看到你持续创作并分享你的学习心得。在这篇博客中，你为读者提供了SQL查询的入门指南，这对那些对数据库查询感兴趣的人来说肯定是非常有帮助的。我想对你的辛勤工作表示赞赏，并对你专注于让读者理解SQL查询的能力表示敬佩。你的解释清晰易懂，让读者能够迅速上手。接下来，我想给你一些建议。既然你已经介绍了SQL查询的入门知识，下一步你可以考虑拓展一些高级的查询技巧，如多表联结、子查询以及聚合函数等等。这些内容将使读者更深入地了解SQL查询的强大之处。继续保持努力和热情，期待你的下一篇博客！谦虚的态度是你持续成长的关键，相信你会越来越出色的！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。