大数据之旅：Hadoop入门与探索（黑马程序员）第一天

最新推荐文章于 2024-07-19 17:17:26 发布

小杨不太会？

最新推荐文章于 2024-07-19 17:17:26 发布

阅读量452

点赞数 11

文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_82383854/article/details/138091271

版权

一，大数据之旅

1.大数据概述

1. 什么是大数据

狭义上：对海量数据进行处理的软件技术体系

广义上：数字化、信息化时代的基础支撑，以数据为生活赋能

2. 大数据的5个主要特征

3. 大数据的核心工作：

存储：妥善保存海量待处理数据

计算：完成海量数据的价值挖掘

传输：协助各个环节的数据传输

二，Hadoop入门

1. 什么是Hadoop

Hadoop是开源的技术框架，提供分布式存储、计算、资源调度的解决方案

2.分布式系统和集群

(1)分布式和集群区别?

分布式：分布式的主要工作是分解任务，将职能拆解，多个人在一起做不同的事集群：集群主要是将同一个业务，部署在多个服务器上，多个人在一起做同样的事

(2)大数据体系中，分布式的调度主要有2类架构模式

去中心化模式,没有明确的中心。众多服务器之间基于特定规则进行同步协调。

中心化模式,有一个中心节点（服务器）来统筹其它服务器的工作，统一指挥，统一调派，避免混乱。

3.Hadoop集群搭建

集群简介：HADOOP集群具体来说包含两个集群：HDFS集群和YARN集群，两者逻辑上分离，但物理上常在一起。

HDFS集群 NameNode、DataNode、SecondaryNameNode

YARN集群 ResourceManager、NodeManager

4.HDFS：分布式文件系统

HDFS是Hadoop的核心组件之一，它提供了高容错性的数据存储能力，可以在低廉的硬件上构建高吞吐量的数据存储集群。HDFS将数据分成多个块（block），并将这些块存储在不同的节点上，实现了数据的分布式存储。通过HDFS，我们可以轻松地对大数据进行存储和管理。

5.MapReduce：分布式计算框架

MapReduce是Hadoop的另一个核心组件，它提供了一种分布式计算框架，用于处理和分析大数据。MapReduce将复杂的计算任务拆分成多个简单的子任务，并在集群中的多个节点上并行执行这些子任务。通过Map和Reduce两个阶段，MapReduce能够高效地处理大规模数据集，并输出计算结果。

经过一段时间的学习和实践，我对Hadoop有了更加深入的了解。虽然目前我还只是Hadoop的初学者，但我已经感受到了它的强大和魅力。未来，我计划继续深入学习Hadoop的生态系统，如HBase、Hive等，以便更好地应对大数据处理的挑战。学习Hadoop的过程虽然充满挑战，但收获也是巨大的。它让我对大数据处理有了全新的认识，也让我更加坚定了自己在IT领域的职业发展方向。我相信，在未来的日子里，随着我对Hadoop技术的不断深入学习和实践，我一定能够在大数据领域取得更好的成绩。

小杨不太会？

关注

11
点赞
踩
3

收藏

觉得还不错? 一键收藏
4
评论
大数据之旅：Hadoop入门与探索（黑马程序员）第一天

狭义上：对海量数据进行处理的软件技术体系广义上：数字化、信息化时代的基础支撑，以数据为生活赋能Hadoop是开源的技术框架，提供分布式存储、计算、资源调度的解决方案。
复制链接

扫一扫

小杨不太会？ CSDN认证博客专家 CSDN认证企业博客

码龄1年

4: 原创

140万+: 周排名

15万+: 总排名

2298: 访问

: 等级

100: 积分

29: 粉丝

54: 获赞

8: 评论

33: 收藏

私信

关注

热门文章

最新评论

大数据之旅：Hadoop入门与探索（黑马程序员）第一天
普通网友: 学到了，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
大数据之旅：Hadoop入门与探索（黑马程序员）第一天
普通网友: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
分布式SQL计算Hive入门（黑马程序员）Day2
普通网友: 写的真好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
分布式SQL计算Hive入门（黑马程序员）Day2
普通网友: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
分布式SQL计算Hive入门（黑马程序员）Day2
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

大家在看

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。